CRC32

Sugestões para melhorar o site

Moderador: jamlvs

Responder
Pacheco_
Newbie
Mensagens: 33
Registado: 09 out 2006, 00:00

CRC32

Mensagem por Pacheco_ » 12 jun 2010, 00:49

(Voltando a uma velha sugestão)

Gostaria de sugerir a implementação (e não teria de ser pelo site, podia ser pelos utilizadores ao postarem) de um sistema de checksum/hash aos ficheiros de vídeo, tipo o CRC32 (ou outro).

A ideia seria facilitar a procura de uma legenda para a nossa release de um filme/episódio (como por exemplo em LOST, Simpsons, etc... que já têm algumas centenas de legendas). Como tal (e usando o CRC32), era só publicar um código de 8 caracteres (hexadecimais) que identificam um ficheiro e que são independentes do nome do ficheiro ou data, mas apenas do seu conteúdo.

Como tal com a aquisição de um determinado filme/episódio (mesmo que renomeado/sem release) era imediato filtrar as legendas que serviriam para esse mesmo filme/episódio (mesmo havendo centenas de legendas registadas para esse filme/série).

Isto permitiria ainda que em certos filmes/series antigas que ninguém sabe já a release (ou nunca se soube) se encontrasse uma legenda para eles (sem ter de experimentar por vezes bastantes).


Esse código é algo que não é muito demorado a calcular (cerca de 1s por cada 50/100mb em discos mais lentos) o que daria cerca de ~10 segundos num filme de 700mb ou ~5s num episódio tipicamente com 350mb (algo que demora a abrir o browser e aceder ao site).

Já uma vez trouxe o assunto, mas talvez não da forma mais correcta (implementando-o directamente) e como tal foi rejeitado e esquecido. Assim venho de uma forma mais correcta reavivar o assunto...

Quanto a assuntos de "legalidade" da coisa, julgo não ser mais fácil encontrar-se o site por esse "código" do que pelo próprio nome de uma release, mas em termos de procura muito mais eficaz (pois releases podem ter espaços ou pontos ou underscores, etc...).

Algo deste género está já a ser implementado em outros sites da concorrência (internacional) e começa já a vir presente nos próprios leitores de vídeo como forma de encontrar legendas para um vídeo - por exemplo o BS.Player)

fica aqui um site de referencia que usa já um hash/checksum:
http://trac.opensubtitles.org/projects/ ... ourceCodes

Fica a ideia para pensarem nela e para ver se os admins a aceitam...

PS: Quanto ao facto de as legendas já postadas não terem essa info, era ir reportando esses dados e adicionando aos poucos (e creio que com a ajudar de todos em poucos meses (3~6) o site teria essa info para tudo ou quase). Sei que isso seria uma sobrecarga para os moderadores, mas se quiserem (e confiarem, claro) posso ficar encarregue de ajudar nesse tipo de coisa...
bernardo126
Subtitle Master
Subtitle Master
Mensagens: 1053
Registado: 15 dez 2006, 00:00

Mensagem por bernardo126 » 12 jun 2010, 01:11

O sistema checksum / hash é como a impressão digital, pessoal e intransmissível, a meu ver (e pelo legendasdivx estar em Portugal gera sempre invejas na concorrência) o facto de estar presente a release é da responsabilidade de quem coloca na "Descrição" agora o facto de ser adicionado um modulo especificamente para isso em questões legais é quase "facilitar" acesso a conteúdo ilegal e por esse motivo dificilmente vai ser implementado.

O que deve ser implementado brevemente é as series por temporada, todas divididas por season para melhor procura e organização.
Pacheco_
Newbie
Mensagens: 33
Registado: 09 out 2006, 00:00

Mensagem por Pacheco_ » 12 jun 2010, 01:22

bernardo126 Escreveu:O sistema checksum / hash é como a impressão digital, pessoal e intransmissível, a meu ver (e pelo legendasdivx estar em Portugal gera sempre invejas na concorrência) o facto de estar presente a release é da responsabilidade de quem coloca na "Descrição" agora o facto de ser adicionado um modulo especificamente para isso em questões legais é quase "facilitar" acesso a conteúdo ilegal e por esse motivo dificilmente vai ser implementado.

O que deve ser implementado brevemente é as series por temporada, todas divididas por season para melhor procura e organização.
Boas,
Compreendo que poderia associado a tal, mas o próprio postar da release já diz por si só tb de onde veio o vídeo... Este "código" é quase como ter a release postada (em termos de legalidade, visto que tb não obrigam os users a omitir a release), mas em termos de procura era uma mais valia sem precedentes.... :)
(até pq era algo "tão simples" que nem precisava de mudanças no site nos posts/sistema de procura... Apensa funciona que eu da outra vez testei e dava na perfeição)

Quanto ao site "alinhar", podia ser tal como disse:
Pacheco_ Escreveu:Gostaria de sugerir a implementação (e não teria de ser pelo site, podia ser pelos utilizadores ao postarem) de um sistema de checksum/hash aos ficheiros de vídeo, tipo o CRC32 (ou outro).
Isto é, ser da responsabilidade dos users essa info, mas deixarem postar isso quem quiser...
Podiam até fazer um "aviso de responsabilidade" ou algo assim algures que dissesse claramente que o tipo de informação contida nos posts era da responsabilidade do utilizador e não do site/donos (tipo o que os sites de "warez" fazem dizendo que não alojam ficheiros apenas links para os ficheiros) (o que aqui seria um não ser da vossa responsabilidade a info dos posts, por vocês só deixarem o user colocar o que ele "quiser" nela, sendo da responsabilidade dele)
Última edição por Pacheco_ em 14 jun 2010, 17:43, editado 2 vezes no total.
Avatar do Utilizador
jamlvs
Admin
Admin
Mensagens: 1420
Registado: 14 nov 2004, 00:00
Localização: Vila Nova de Gaia

Mensagem por jamlvs » 14 jun 2010, 15:46

Boas,

Pacheco_, 1º devias ter esperado pela minha resposta. A falta de resposta da minha parte não é um sim. Visto que já uma altura este tópico foi criado e posteriormente apagado, acho que devias ter esperado por uma resposta minha.

Quanto à ideia, acho que o Bernardo já disse tudo e, segundo a tua lógica, qualquer dia pomos links edk e torrent's visto que "não é pirataria, são apenas ficheiros de 1k"...

Quanto ao link para a opensubtitles.org, estamos em ramos diferentes, não não temos 500 popups sempre que se quer uma legenda, não fornecemos links para warez nem iremos fornecer links de forma a informar qual a release exacta a que a legenda se destina. Este site é um site de legendas. Só isso. Um site onde pessoas fazem legendas para consumo próprio e disponibiliza o seu trabalho com uma comunidade, depois cada utilizador é responsável pelo uso que dá a essa mesma legenda. Eu por exemplo, só tiro legendas para os DVD's importados que não têm legendas em Português, independentemente da release descrita, pego nessa legenda e adapto aos DVD's que compro.

Agradeço-te a disponibilidade até porque seria um sistema para melhorar o site, mas quanto a mim, é o mesmo que ter warez e isso não nos interessa.

[[ ]]
Pacheco_
Newbie
Mensagens: 33
Registado: 09 out 2006, 00:00

Mensagem por Pacheco_ » 14 jun 2010, 17:30

jamlvs Escreveu:Pacheco_, 1º devias ter esperado pela minha resposta. A falta de resposta da minha parte não é um sim. Visto que já uma altura este tópico foi criado e posteriormente apagado, acho que devias ter esperado por uma resposta minha.
Desculpa pelo caso, mas pensei em colocar isto no forum para que se pudesse "discutir" entre todos ideias (e implementar-se isto ou não), ou de alguém até ter alguma ideia sobre o assunto (nem que fosse por um outro caminho completamente diferente)... Não foi de maneira nenhuma para apressar a coisa ou passar por cima de ninguém... Desculpa se assim o fiz parecer. :(
jamlvs Escreveu:Quanto à ideia, acho que o Bernardo já disse tudo e, segundo a tua lógica, qualquer dia pomos links edk e torrent's visto que "não é pirataria, são apenas ficheiros de 1k"...

(etc....)
Ouçam, referi os sites warez por referir. Obviamente que não quero que ninguém tenha problemas de pirataria... (ou me estou a explicar mal, ou então não sei).
O que tencionava fazer era facilitar a vida a todos, implementando uma maneira muito mais eficaz de encontrar uma legenda (sem ter de mudar código fonte do site)... E isso era gerando um código (CRC32) mas o mesmo pode ser feito com o tamanho do ficheiro em bytes, que ao que parece tb é mais que suficiente para filtrar e aparecerem resultados quase só para o que se quer. (o que acontece no site showsdb.org - onde eles têm armazenado o tamanho e o CRC de séries, e se experimentarem procurar por tamanho um ficheiro nosso, ele praticamente sempre só encontra o que queremos, sem falsos resultados).
Poder-se-ia ir por aí tb, ou seja, incluir o tamanho do ficheiro em bytes (é apenas ir às propriedades do ficheiro e copiar o valor - instantâneo) e já ajudava na procura... A vantagem do outro é que ao fim de alguns milhares de ficheiros catalogados é mais fácil haver alguns com o mesmo tamanho do que com o mesmo código CRC...
jamlvs Escreveu:Agradeço-te a disponibilidade até porque seria um sistema para melhorar o site, mas quanto a mim, é o mesmo que ter warez e isso não nos interessa.


Espero que agora fique mais claro a minha ideia, e que ninguém volte a achar que quero transformar isto num site warez (ou algo parecido). São ideias, não têm de as aceitar (CLARO!), mas gosto de as "discutir" e não só receber um não (como devem compreender).

Quanto à disponibilidade, continua de pé (caso implementem OU NÃO) se precisarem de ajuda na moderação ou ideias para o site...

Cumprimentos
Avatar do Utilizador
jamlvs
Admin
Admin
Mensagens: 1420
Registado: 14 nov 2004, 00:00
Localização: Vila Nova de Gaia

Mensagem por jamlvs » 14 jun 2010, 19:07

O grande problema de discutir uma ideia é mesmo do que se fala... Não se pode discutir abertamente sem falar deste ou daquele site e do modo que eles funcionam...

Já apaguei este texto 3 vezes pois ao tentar dar exemplos, acabo sempre por falar em sites de warez, afinal, o motivo da necessidade dos CRC32 é por causa dos sites que abrem como cogumelos e editam os nomes das releases...

Agora, se as pessoas não sabem o que é uma scene release, se sacam material em servidores abertos pelo FBI ou mesmo pela GNR, não devemos ser nós a educar essas pessoas, cada um olha por si.

E volto a dizer, associar a legenda ao ficheiro de vídeo é muito grave. Nós só disponibilizamos ficheiros de texto em que as pessoas podem por mil e uma descrições, agora, ter um ficheiro que nos diz exactamente o ficheiro correcto, por muito jeito que faça, vai tornar (e muito) o sistema ilegal.

Espero que entendas.

[[ ]]
Pacheco_
Newbie
Mensagens: 33
Registado: 09 out 2006, 00:00

Mensagem por Pacheco_ » 14 jun 2010, 22:08

jamlvs Escreveu:(...) o motivo da necessidade dos CRC32 é por causa dos sites que (...) editam os nomes das releases...
Não necessariamente só...
Imagina (e um mero exemplo) que precisas agora de uma legenda para um episódio qq de lost (por exemplo) da season 1 (que não esteja num dos packs mais recentes)... São cerca de 25 páginas de legendas (algumas já sem info da release ou não têm a release que precisamos - até pq em lost.S01.hdtv houve quase 1/3 de episódios nukados), pelo que procurar e experimentar cada uma que encontrar pode ser um trabalho demorado e aborrecido. Com um método de "associação" apenas me apareciam as legendas que DE CERTEZA DAVAM! :)
jamlvs Escreveu:(...) as pessoas podem por mil e uma descrições, agora, ter um ficheiro que nos diz exactamente o ficheiro correcto, por muito jeito que faça, vai tornar (e muito) o sistema ilegal.

Por um lado, claro que entendo (e até mais pq sendo tu um responsável pelo site), se houver m*rd* caem-te em cima... Se fosse eu no teu lugar tb era muito cauteloso.
Por outro lado, custa-me a que isto seja mais ilegal que alguns posts de legendas que dão pra mil e uma releases (alguns até onde estive envolvido) (fogo, tiveram de as sacar+experimentar quase todas para dizer que dão - quão ilegal não será já isto? :-o ).

Mas pronto, compreendo a tua reticencia...
Fica o assunto para dormirem sobre, e depois se sempre decidirem permitir algum dos métodos (nem que seja só o do tamanho) apitem :wink:

Cumprimentos
Pacheco

PS: Tb concordo que de onde cada um saca é consigo... Há que ter cuidado (cada vez mais). Aí estou a 100% contigo :D
Responder