5 serviços de OCR on-line gratuitos testados e revisados


Tem um documento PDF ou uma imagem que você gostaria de converter em texto? Recentemente, alguém me enviou um documento no correio que eu precisava editar e enviar de volta com correções. A pessoa não conseguiu localizar uma cópia digital, então fui encarregado de colocar todo esse texto em formato digital.

Não havia como eu passar horas digitando tudo de volta, então acabei levando uma boa foto de alta qualidade do documento e, em seguida, gravei um monte de serviços on-line de OCR para ver qual deles me daria os melhores resultados.

Neste artigo, vou passar por um casal dos meus sites favoritos para o OCR que são gratuitos. Vale a pena notar que a maioria desses sites fornece um serviço gratuito básico e depois tem opções pagas se você quiser recursos extras como imagens maiores, documentos PDF de várias páginas, diferentes idiomas de entrada, etc.

Também é bom saiba de antemão que a maioria desses serviços não será capaz de corresponder à formatação do documento original. Estas são principalmente para extrair texto e é isso. Se você precisa que tudo esteja em um layout ou formato específico, você terá que fazer isso manualmente assim que receber todo o texto do OCR.

Além disso, os melhores resultados para obter o texto virão de documentos com uma resolução de 200 a 400 DPI. Se você tem uma imagem com baixa DPI, os resultados não serão tão bons.

Por fim, muitos sites que testei não funcionaram. Se você usa o OCR on-line gratuito do Google, verá vários sites, mas vários dos 10 primeiros resultados não concluíram a conversão. Alguns terminariam, outros dariam erros e alguns apenas ficavam presos na página de "conversão", então nem me incomodei em mencionar esses sites.

Para cada site, testei dois documentos para ver quão bem a saída seria. Para os meus testes, eu simplesmente usei o meu iPhone 5S para tirar uma foto de ambos os documentos e depois os enviei diretamente para os websites para conversão.

Caso você queira ver como eram as imagens que eu usava meu teste, eu os anexei aqui: Test1 e Test2. Observe que essas não são versões com resolução total das imagens tiradas do telefone. Eu usei a imagem de resolução completa ao fazer o upload para os sites.

OnlineOCR

OnlineOCR.net é um site limpo e simples que forneceu resultados muito bons no meu teste. A principal coisa que eu gosto é que ele não tem toneladas de anúncios em todo o lugar, o que normalmente é o caso com esses tipos de sites de serviços de nicho.

free online ocr

Para começar, selecione seu arquivo e aguarde até que ele termine o upload. O tamanho máximo de upload para este site é de 100 MB. Se você se inscrever para uma conta gratuita, receberá alguns recursos extras, como o tamanho de upload maior, PDFs de várias páginas, diferentes idiomas de entrada, mais conversões por hora, etc.

Em seguida, escolha seu idioma de entrada e em seguida, escolha o formato de saída. Você pode escolher entre Word, Excel ou Texto Simples. Clique no botão Convertere você verá o texto exibido na parte inferior em uma caixa junto com um link de download.

ocr output

Se tudo o que você quer é o texto, basta copiá-lo e colá-lo na caixa. No entanto, sugiro que você faça o download do documento do Word porque ele faz um trabalho surpreendentemente bom em manter o layout do documento original.

Por exemplo, quando abri o documento do Word para o segundo teste, fiquei surpreso Descobrir que o documento incluía uma tabela com três colunas, assim como na imagem.

online ocr output

Fora de todos os sites, esse foi o melhor de longe. Vale a pena registrar-se se você precisar fazer muitas conversões.

Para completar, também vou vincular aos arquivos de saída criados por cada serviço para que você possa ver os resultados por si mesmo. Aqui estão os resultados do OnlineOCR: Test1 Doc e Doc Test2.

Observe que ao abrir esses documentos do Word em seu computador, você receberá uma mensagem em Palavra informando que é da Internet e edição foi desativada. Isso é perfeitamente OK porque o Word não confia em documentos da Internet e você realmente não precisa ativar a edição se quiser apenas visualizar o documento.

i2OCR

Outro site que deu bons resultados foi i2OCR. O processo é muito semelhante: escolha o idioma, o arquivo e pressione Extrair texto.

i2ocr

Você tem que esperar um minuto ou dois aqui porque este site demora um pouco mais. Além disso, na Etapa 2, certifique-se de que sua imagem esteja sendo exibida do lado direito na visualização, caso contrário, você obterá um monte de conteúdo sem sentido. Por algum motivo, as imagens do meu iPhone estavam sendo exibidas no modo retrato no meu computador, mas em paisagem quando eu fiz o upload para este site.

i2ocr output

tinha que abrir manualmente a imagem em um aplicativo de edição de fotos, girá-la 90 graus, depois girá-la de volta ao retrato e depois salvá-la novamente. Depois de concluído, role para baixo e ele mostrará uma prévia do texto junto com um botão de download.

Este site se saiu muito bem com a saída do primeiro teste, mas não se saiu tão bem com o segundo teste que tinha o layout da coluna. Aqui estão os resultados do i2OCR: Test1 Doc e Doc Test2.

FreeOCR

Free-OCR.com suas imagens e convertê-las em texto simples. Não tem uma opção para exportar para o formato do Word. Escolha seu arquivo, selecione um idioma e clique em Iniciar.

O site é rápido e você obterá a saída rapidamente. Basta clicar no link para fazer o download do arquivo de texto para o seu computador.

freeocr

Como com o NewOCR mencionado abaixo, este site capitaliza todos os T's em o documento. Não tenho ideia de por que isso faria isso, mas, por alguma razão estranha, esse site e o NewOCR fizeram isso. Não é grande coisa mudar isso, mas é um processo tedioso que você realmente não deveria ter que fazer.

Aqui estão os resultados do FreeOCR: Test1 Doc e .

ABBYY FineReader Online

Para usar FineReader Online, você precisa se registrar para uma conta, o que faz com que você tenha 15 dias teste gratuito para OCR até 10 páginas gratuitamente. Se você só precisa fazer um OCR único para algumas páginas, então você pode usar este serviço. Certifique-se de clicar no link verificar no e-mail de confirmação depois de se registrar.

finereader online

Clique em Reconhecerna parte superior e clique em Fazer uploadpara selecionar seu arquivo. Escolha seu idioma, formato de saída e clique em Reconhecerna parte inferior. Este site tem uma interface limpa e nenhum anúncio também.

Nos meus testes, este site conseguiu pegar o texto do primeiro documento de teste, mas foi absolutamente enorme quando eu abri o documento do Word, então eu Acabei fazendo isso novamente e escolhendo Plain Text como o formato de saída.

Para o segundo teste com as colunas, o documento do Word estava vazio e eu não consegui nem encontrar o texto. Não tenho certeza do que aconteceu lá, mas parece que não consegue lidar com nada além de parágrafos simples. Aqui estão os resultados do FineReader: Test1 Doc e Doc Test2.

NewOCR

O próximo site, NewOCR.com, foi OK, mas não tão bom quanto o primeiro site. Em primeiro lugar, tem anúncios, mas felizmente não muito. Primeiro seleccione o seu ficheiro e depois clique no botão Pré-visualizar.

upload image

Pode então rodar a imagem e ajustar a área onde você deseja digitalizar para texto. É basicamente como o processo de verificação funciona em um computador com um scanner conectado.

23

Se o documento tiver várias colunas, você pode verifique o botão Análise de layout de páginae ele tentará dividir o texto em colunas. Clique no botão OCR, aguarde alguns segundos até que ele seja concluído e role até a parte inferior quando a página for atualizada.

No primeiro teste, ele obteve todo o texto corretamente, mas, por algum motivo, capitalizou todos os T no documento! Não sei por que isso faria isso, mas aconteceu. No segundo teste com a análise de página ativada, ele ficou com a maior parte do texto, mas o layout ficou completamente desativado.

Aqui estão os resultados do NewOCR: Test1 Doc e Doc Test2.

Conclusão

Como você pode ver, o free não oferece resultados muito bons na maioria das vezes, infelizmente. O primeiro site mencionado é o melhor, de longe, porque não só fez um grande trabalho de reconhecer todo o texto, mas também conseguiu manter o formato do documento original.

Se você só precisa de texto, embora , a maioria dos sites acima deve ser capaz de fazer isso por você. Se você tiver alguma dúvida, fique à vontade para comentar. Aproveite!

Postagens relacionadas:


2.12.2015