Se você está procurando uma maneira simples e precisa de localizar e substituir texto em arquivos PDF, você veio ao lugar certo. Neste artigo, você aprenderá como substituir um determinado texto em um PDF usando Python. Ao escrever algumas linhas de código, você pode analisar todo o PDF para pesquisar e substituir as palavras/frases desejadas.
- Biblioteca Python para localizar e substituir texto em PDF
- Localizar e substituir texto em PDF usando Python
- Ferramenta online para substituir texto em Python
Biblioteca Python para localizar e substituir texto em PDF
Para localizar e substituir texto em arquivos PDF, usaremos Aspose.PDF for Python. É uma biblioteca Python robusta para criar e processar arquivos PDF sem esforço. A biblioteca também permite localizar e substituir texto em arquivos PDF com alta precisão e velocidade.
Para instalar a biblioteca, você pode usar o seguinte comando pip.
> pip install aspose-pdf
Localizar e substituir texto em PDF usando Python
As etapas a seguir explicam como localizar e substituir texto em um documento PDF usando Python com a ajuda do Aspose.PDF.
- Carregue o PDF de seu caminho usando a classe Document.
- Crie uma instância da classe TextFragmentAbsorber e forneça a frase de pesquisa para seu construtor.
- Aceite o absorvedor de texto para todas as páginas do PDF usando doc.pages.accept(textabsorber).
- Obtenha os fragmentos de texto extraídos em um objeto.
- Percorra os fragmentos de texto encontrados e substitua o texto em cada fragmento.
- Finalmente, salve o documento PDF atualizado usando o método Document.save().
O exemplo de código a seguir mostra como localizar e substituir texto em PDF usando Python.
# Carregar o documento PDF
document = ap.Document("input.pdf")
# Instanciar um objeto TextFragmentAbsorber
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")
# Pesquisar texto
document.pages.accept(txtAbsorber)
# Obter referência aos fragmentos de texto encontrados
textFragmentCollection = txtAbsorber.text_fragments
# Analisar todos os fragmentos de texto pesquisados e substituir o texto
for txtFragment in textFragmentCollection:
txtFragment.text = "replaced-text"
# Salve o PDF atualizado
document.save("output.pdf")
Ferramenta online para substituir texto em PDF
Também desenvolvemos uma ferramenta online para substituir texto em arquivos PDF, baseada no Aspose.PDF para Python. Você pode usar esta ferramenta de qualquer lugar, a qualquer hora, apenas com uma conexão com a Internet.
Biblioteca Python gratuita para substituir texto em PDF
Você pode obter uma licença temporária gratuita e substituir texto em arquivos PDF sem quaisquer limitações.
Além disso, você pode explorar outros recursos da biblioteca Python PDF usando a documentação. Além disso, escreva para nós em nosso fórum sobre seus problemas, sugestões ou comentários.
Conclusão
Neste artigo, você aprendeu como analisar um PDF e localizar e substituir um determinado texto usando Python. Em algumas linhas de código, você pode pesquisar e substituir texto em um lote de arquivos PDF. Além disso, fornecemos a você uma ferramenta online gratuita para substituir texto em arquivos PDF. Você pode usar esta ferramenta de qualquer dispositivo com conexão à Internet.