Python encontra e substitui texto em PDF

Se você está procurando uma maneira simples e precisa de localizar e substituir texto em arquivos PDF, você veio ao lugar certo. Neste artigo, você aprenderá como substituir um determinado texto em um PDF usando Python. Ao escrever algumas linhas de código, você pode analisar todo o PDF para pesquisar e substituir as palavras/frases desejadas.

Biblioteca Python para localizar e substituir texto em PDF

Para localizar e substituir texto em arquivos PDF, usaremos Aspose.PDF for Python. É uma biblioteca Python robusta para criar e processar arquivos PDF sem esforço. A biblioteca também permite localizar e substituir texto em arquivos PDF com alta precisão e velocidade.

Para instalar a biblioteca, você pode usar o seguinte comando pip.

> pip install aspose-pdf

Localizar e substituir texto em PDF usando Python

As etapas a seguir explicam como localizar e substituir texto em um documento PDF usando Python com a ajuda do Aspose.PDF.

  1. Carregue o PDF de seu caminho usando a classe Document.
  2. Crie uma instância da classe TextFragmentAbsorber e forneça a frase de pesquisa para seu construtor.
  3. Aceite o absorvedor de texto para todas as páginas do PDF usando doc.pages.accept(textabsorber).
  4. Obtenha os fragmentos de texto extraídos em um objeto.
  5. Percorra os fragmentos de texto encontrados e substitua o texto em cada fragmento.
  6. Finalmente, salve o documento PDF atualizado usando o método Document.save().

O exemplo de código a seguir mostra como localizar e substituir texto em PDF usando Python.

# Carregar o documento PDF
document = ap.Document("input.pdf")

# Instanciar um objeto TextFragmentAbsorber
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")

# Pesquisar texto
document.pages.accept(txtAbsorber)

# Obter referência aos fragmentos de texto encontrados
textFragmentCollection = txtAbsorber.text_fragments

# Analisar todos os fragmentos de texto pesquisados e substituir o texto
for txtFragment in textFragmentCollection:
    txtFragment.text = "replaced-text"

# Salve o PDF atualizado
document.save("output.pdf")

Ferramenta online para substituir texto em PDF

Também desenvolvemos uma ferramenta online para substituir texto em arquivos PDF, baseada no Aspose.PDF para Python. Você pode usar esta ferramenta de qualquer lugar, a qualquer hora, apenas com uma conexão com a Internet.

Biblioteca Python gratuita para substituir texto em PDF

Você pode obter uma licença temporária gratuita e substituir texto em arquivos PDF sem quaisquer limitações.

Além disso, você pode explorar outros recursos da biblioteca Python PDF usando a documentação. Além disso, escreva para nós em nosso fórum sobre seus problemas, sugestões ou comentários.

Conclusão

Neste artigo, você aprendeu como analisar um PDF e localizar e substituir um determinado texto usando Python. Em algumas linhas de código, você pode pesquisar e substituir texto em um lote de arquivos PDF. Além disso, fornecemos a você uma ferramenta online gratuita para substituir texto em arquivos PDF. Você pode usar esta ferramenta de qualquer dispositivo com conexão à Internet.

Veja também