Não é possível copiar texto de um arquivo PDF?


Então eu tive um problema no outro dia quando tive que copiar algum texto de um arquivo PDF e colá-lo em uma apresentação que eu estava fazendo. O problema foi que não consegui copiar o texto! Hmm, eu pensei, deve haver algo estúpido que eu estou fazendo desde que eu tenho certeza que eu copiei o texto de um arquivo PDF antes.

Por sorte, eu não fui tão estúpida, pois acabou sendo o arquivo PDF tinha várias páginas que eram arquivos de bitmap digitalizados que haviam sido inseridos no PDF. Portanto, não foi um texto real em primeiro lugar. Em segundo lugar, onde havia um texto real que normalmente poderia ser copiado, esse PDF tinha algum tipo de permissão de segurança definida para que a cópia de conteúdo não fosse permitida! Grrrr!

Eu ainda precisava desse texto e eu iria descobrir uma maneira de obtê-lo. Neste artigo, vou percorrer a maneira simples de copiar o texto que funciona se o documento não estiver protegido e o texto não for uma imagem digitalizada. Eu também vou ver o que fazer no cenário mais complicado, onde você não tem permissão para copiar o texto. Não é uma solução ideal, mas é melhor do que nada, especialmente se você precisar copiar muito texto. Mesmo que você consiga economizar para digitar 80% manualmente, isso é ótimo!

Selecionando texto em um PDF

No Adobe Reader, se o texto puder ser copiado, tudo que você basta selecionar e clicar com o botão direito do mouse e escolher Copiar.

copiar texto pdf

Em outros programas de visualização de PDF, como o Foxit , você tem que clicar em Ferramentase, em seguida, Selecionar texto.

selecionar texto

Obviamente, Se você fosse capaz de fazer isso, você não estaria lendo este post! Mas, apenas no caso, é assim que você seleciona o texto. Agora, para a questão mais difícil de copiar texto de imagens ou arquivos PDF protegidos.

Use o OCR para copiar texto PDF

Você pode verificar rapidamente se um arquivo PDF está protegido no Adobe Leitor olhando na barra de título e procurando pela palavra SECURED.

pdf protegido

Você pode ver permissões específicas clicando em Editare, em seguida, clicando em Proteçãoe em Propriedades de segurança.

propriedades de segurança

Nas versões mais recentes do Adobe Reader e do Acrobat, você precisa clicar em Protectno painel direito para exibir as opções de proteção.

Em seguida, clique em Mais opçõese você verá as Propriedades de segurança.

Como você pode ver abaixo, a cópia de conteúdo não é permitida e a segurança é protegida por uma senha. Se você souber a senha, poderá remover a segurança e copiar tudo o que quiser.

A menos que você seja um hacker, violar a senha não é uma opção. Assim, a única outra coisa que você pode fazer é tirar uma captura de tela do texto e depois executá-lo através de um programa de OCR. Soa como muito trabalho, mas realmente não é. Você pode fazer uma captura de tela em um Mac ou PC sem software adicional.

Mac- Basta pressionar Command + Shift + 4 no teclado

Windows- Basta usar a ferramenta de recorte do Windows

cópia de conteúdo

Além disso, se você possui o Adobe Acrobat, pode usá-lo para converter automaticamente o texto da imagem em texto editável. Tudo o que você precisa fazer é abrir o arquivo PDF e clicar na ferramenta Editar PDF no painel direito. Ele digitalizará automaticamente todo o documento usando o OCR e o converterá em um documento totalmente editável.

Se você tiver uma imagem com texto, copie-a para a área de transferência e abra o Adobe Acrobat e escolha Arquivo - Criar - PDF da área de transferência.

Basta clicar em Editar PDF no painel direito e ele converterá a imagem em editável texto.

Aqui está uma captura de tela que tirei de algum texto que não consegui copiar de um arquivo PDF protegido:

TestOCR

Tenha em atenção que, quando tira a captura de ecrã, certifique-se de que o zoom do documento está definido para 100%, para que o texto fique nítido e claro. Depois de ter a captura de tela, faça o download de um programa gratuito de OCR. Há muitas opções disponíveis e os resultados variam muito entre os programas, por isso você terá que experimentar alguns. Aqui estão dois que eu usei no passado:

http://download.cnet.com/FreeOCR/3000-10743_4-10717191.html

https://www.simpleocr.com/OCR-Freeware

você também pode usar o Microsoft OneNote, pois ele possui a funcionalidade OCR incorporada. Obviamente, se você já possui um software OCR, basta usar esse programa.

O programa FreeOCR funciona bem, você só precisa ter certeza de que, ao instalá-lo, não aceite nenhum outro software. “Oferece”, que apenas instalará lixo no seu computador. Mas, desde que você faça isso, o software não tem spyware nem nada parecido. Ele também é testado pela CNET para garantir isso.

De qualquer forma, depois de instalar o programa, clique no grande botão Abrire escolha sua imagem.

ocr image

Ele mostrará uma prévia da imagem no painel esquerdo. Em seguida, clique em OCRe Iniciar processo de OCR.

iniciar processo ocr

É isso! O texto agora aparecerá no lado direito e você poderá copiá-lo para a área de transferência ou exportá-lo para o Microsoft Word.

converter imagem em texto

o programa fez um trabalho muito bom com alguns pequenos erros aqui e ali. Isso me poupou muito tempo, embora não precise digitar manualmente todo esse texto. Espero que isso ajude a copiar o texto que você precisa de um documento PDF. Poste quaisquer comentários ou perguntas e eu responderei. Aproveite!

Como copiar e colar de um PDF protegido (Desbloquear PDF)

Postagens relacionadas:


14.08.2012