Página 1 de 2

Extrair legendas Embutidas (hardcoded)

Enviado: 27 mai 2020, 05:38
por zundengan
Como vi que no fox movies estão a dar um ciclo de cinema de westerns clássicos e alguns filmes de blaxploitation lembrei-me de ir pesquisar uma nova ferramenta para extrair legendas hardcoded.

Infelizmente a que encontrei não tem executável em windows e como sou meio leigo na coisa não testei.

Contudo vou deixar aqui o que encontrei, caso alguém queira e saiba testar possa deixar a sua opinião.

Há um tutorial muito bom aqui no fórum em alternativa a este método que também aconselho, mas presumo que este processo com a ferramenta que deixo, apesar de moroso e intensivo para o CPU consiga exigir menos atenção e passos e seja mais automatizado (e simples para quem sabe usar comandos).

https://github.com/apm1467/videocr

https://pypi.org/project/videocr/

Re: Extrair legendas Embutidas (hardcoded)

Enviado: 27 mai 2020, 06:05
por guardiao
Obrigado pela dica, estive a ver o código fonte e não é nada de especial, é um simples script que usa o Tesseract para o OCR.

Re: Extrair legendas Embutidas (hardcoded)

Enviado: 27 mai 2020, 07:53
por zundengan
guardiao Escreveu:
27 mai 2020, 06:05
Obrigado pela dica, estive a ver o código fonte e não é nada de especial, é um simples script que usa o Tesseract para o OCR.
Ora essa, estive entretido a pesquisar ocr engines, há mais engines além do tesseract.

Acho estranho é ninguém se ter lembrado de usar esses engines opensource antes.

Fixe era haver um executável para leigos.

Outra ferramenta fixe que encontrei foi o copyfish, ocr related, https://ocr.space/copyfish.

Deve dar jeito para o amazon turk eheheh ou ainda para traduzir frases embutidas em imagens.

O guardião não se esqueça é de dizer se isso funciona mais ou menos, como deve de ser, ou às mil maravilhas eheheh.

Re: Extrair legendas Embutidas (hardcoded)

Enviado: 28 mai 2020, 01:06
por RICARDOB
Agradeço tb. Uma vez q tb ando a testar estas coisas. :D

Re: Extrair legendas Embutidas (hardcoded)

Enviado: 28 mai 2020, 03:11
por zundengan
RICARDOB Escreveu:
28 mai 2020, 01:06
Agradeço tb. Uma vez q tb ando a testar estas coisas. :D
Não sei se há uma ferramenta melhor, desconfio que sim... mas se calhar ainda não foi lançada a aplicação...

O guardião é que te podia dar umas dicas porque ele já testou, se ele não se importar claro...

:oops:

Re: Extrair legendas Embutidas (hardcoded)

Enviado: 28 mai 2020, 19:40
por RICARDOB
Já deu. :D

Re: Extrair legendas Embutidas (hardcoded)

Enviado: 29 mai 2020, 02:46
por zundengan
RICARDOB Escreveu:
28 mai 2020, 19:40
Já deu. :D
cool, sabes que há quem se lembre primeiro das coisas.

O que conta é partilhar as descobertas. :wink:

Re: Extrair legendas Embutidas (hardcoded)

Enviado: 12 mai 2021, 14:42
por corre
@zundengan @RICARDOB @guardiao, algum de voc~es conseguir por isto a funcionar e executar em windows? se sim, podem fazer uma pequena explicação do processo?

Re: Extrair legendas Embutidas (hardcoded)

Enviado: 12 mai 2021, 19:50
por zundengan
o mais fácil é usares o subfinder e depois passar para o subtitle edict com o tesseract
download aqui
https://www.videohelp.com/software/VideoSubFinder

Re: Extrair legendas Embutidas (hardcoded)

Enviado: 12 mai 2021, 19:54
por corre
@zundengan o videosubfinder ja conhecia, ate usava depois o abby fine reader, mas era um processo que poderia dar erros, e entao era perder tempo duas vezes para corrigir.
mas entao como depois intalo esse tesseract?