Top Qs
Linha do tempo
Chat
Contexto
Tesseract (software)
Da Wikipédia, a enciclopédia livre
Remove ads
Tesseract é um software de reconhecimento ótico de caracteres de código aberto (Licença Apache 2.0),[2] originalmente desenvolvido pela Hewlett-Packard e foi por um tempo mantido pelo Google; atualmente o projeto está hospedado no GitHub.
Se aplica a imagens em formato tiff com texto puro em uma única coluna, convertendo a saída em um arquivo txt. Não possui mecanismos para reconhecimento de layout, desta forma não é recomendável para textos que possuam imagens, fórmulas ou mais de uma coluna.
Remove ads
Referências
- «Releases – tesseract-ocr/tesseract». GitHub (em inglês). Consultado em 25 de maio de 2025
- https://github.com/tesseract-ocr/tesseract/blob/master/README.md Consultado em 4 de fevereiro de 2016
Ligações externas
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads