Aplicativo experimental para reconhecimento óptico de caracteres (OCR) Este aplicativo é um aplicativo experimental que desenvolvi há vários anos que demonstra o uso do motor Tesseract OCR para reconhecer texto em imagens capturadas pela câmera do dispositivo. Este aplicativo executa OCR em seu dispositivo – sem carregar suas imagens para um servidor – e é adequado para reconhecer palavras individuais ou frases curtas de texto, mas este aplicativo é destinado a hobbyists e desenvolvedores de software interessados em OCR e não para públicos em geral. Em contraste com a API mobile vision do Google, este aplicativo é capaz de reconhecer texto impresso em fontes não baseadas em latim enquanto estiver off-line. Para isso, este aplicativo incorpora uma quantidade extraordinariamente grande de dados de treinamento para vários idiomas. Esses dados de treinamento são armazenados em seu telefone, e este aplicativo ocupa muito mais espaço do que aplicativos comuns. Nenhum pré-processamento de imagem é realizado por este aplicativo antes de entregar quadros de imagem capturados ao Tesseract, de modo que o aplicativo não está sintonizado para qualquer caso de uso específico e, como resultado, sua precisão e velocidade de reconhecimento dependem fortemente de fatores situacionais como perspectiva, iluminação e tipo de fonte. O código-fonte deste aplicativo está disponível no GitHub (com pequenas alterações para acomodar as restrições de tamanho de arquivo do GitHub). O código para este aplicativo é uma combinação de código relacionado à câmera de código aberto do projeto ZXing bar code scanner e código de reconhecimento óptico de caracteres de código aberto do projeto Tesseract OCR. CAPTURA DE TEXTO A captura padrão de um único tiro executa o OCR em uma imagem snapshot capturada quando você clica no botão do obturador, como uma foto normal. Quando a caixa de seleção "visualização contínua" é verificada, o aplicativo mostra uma exibição dinâmica e em tempo real do que o dispositivo está reconhecendo ao lado do visor da câmera. O modo de visualização contínua funciona melhor em um dispositivo rápido. USANDO ESTE APLICATIVO • Aponte o dispositivo para uma pequena região de texto e toque no botão do obturador na tela para iniciar o OCR. • Para reconhecer caracteres chineses/japoneses/coreanos individuais, defina o modo de segmentação de páginas como "caractere único". PRECISÃO DE RECONHECIMENTO • Vários fatores podem fazer com que o OCR falhe: iluminação desigual, texto estilizado ou texto sem contraste suficiente do plano de fundo. Tente ter uma boa iluminação. • Mantenha o dispositivo estável e certifique-se de que a imagem está em foco. • Se você precisar digitalizar um grande bloco de texto ou um documento inteiro, tente um aplicativo de digitalização de documentos, como o Text Fairy. Idiomas • Este app suporta vários idiomas/scripts não reconhecidos pelo Google Translate. • Línguas suportadas para OCR: Africâner Albanês Amárico Árabe Assamês Azerbaijão Azerbaijão (cirílico) Basco Bielo-russo Bengalês Bósnio Búlgaro Birmanês Catalão Cebuano Cherokee Chinês (Simplificado) Chinês (Tradicional) Croata Tcheco Dinamarquês Holandês Dzongkha Inglês Inglês, Médio (1100-1500) Esperanto Estoniano Finlandês Franco Francês Francês, Médio (ca. 1400-1600) Galego Georgiano Georgiano - Velho Alemão Grego, Antigo (-1453) Grego, Moderno (1453-) Guzerate Haitiano Hebraico Hindi Húngaro Islandês Indonésio Inuktitut Irlandês Italiano Italiano - Velho Japonês Javanês Kannada Cazaque Khmer Coreano Curdo Quirguiz Lao Latina Letão Lituano Macedónio Malaio Malaiala Maltês Marata Nepalês Norueguês Oriya Pachto Persa Polonês Português Punjabi Romeno Russo Sânscrito Sérvio Sérvio (latim) Cingalês Eslovaco Esloveno Espanhol Espanhol - Velho Suaíle Sueco Siríaco Tagalog Tadjique Tâmil Telugu Tailandês Tibetano Tigrinya Turco Ucraniano Urdu Uyghur Uzbeque Uzbeque (Cirílico) Vietnamita Galês Iídiche NOTAs DO DISPOSITIVO SAMSUNG • Nos dispositivos Samsung Galaxy, você pode precisar pressionar o botão do menu para definir preferências.
história da versão
- Versão 0.5.14 postado em 2014-05-11
- Versão 0.4.3 postado em 2011-05-13
Várias correções e atualizações
Detalhes do programa
- Categoria: Desenvolvimento > Componentes & Bibliotecas
- Editor: Robert Theis
- Licença: Livre
- Preço: N/A
- Versão: 0.6.0
- Plataforma: android