Python trova e sostituisce il testo in PDF

Se stai cercando un modo semplice ma accurato per trovare e sostituire il testo nei file PDF, sei nel posto giusto. In questo articolo imparerai come sostituire un particolare testo in un PDF usando Python. Scrivendo poche righe di codice è possibile analizzare l’intero PDF per cercare e sostituire le parole/frasi desiderate.

Libreria Python per trovare e sostituire il testo in PDF

Per trovare e sostituire il testo nei file PDF, useremo Aspose.PDF for Python. È una robusta libreria Python per creare ed elaborare file PDF senza sforzo. La libreria consente inoltre di trovare e sostituire il testo nei file PDF con elevata precisione e velocità.

Per installare la libreria, puoi utilizzare il seguente comando pip.

> pip install aspose-pdf

Trova e sostituisci testo in PDF usando Python

I seguenti passaggi spiegano come trovare e sostituire il testo in un documento PDF utilizzando Python con l’aiuto di Aspose.PDF.

  1. Carica il PDF dal suo percorso utilizzando la classe Documento.
  2. Crea un’istanza della classe TextFragmentAbsorber e fornisci la frase di ricerca al relativo costruttore.
  3. Accetta l’assorbitore di testo per tutte le pagine del PDF utilizzando doc.pages.accept(textabsorber).
  4. Ottieni i frammenti di testo estratti in un oggetto.
  5. Passa in rassegna i frammenti di testo trovati e sostituisci il testo in ciascun frammento.
  6. Infine, salva il documento PDF aggiornato utilizzando il metodo Document.save().

L’esempio di codice seguente mostra come trovare e sostituire il testo in PDF usando Python.

# Carica il documento PDF
document = ap.Document("input.pdf")

# Crea un'istanza di un oggetto TextFragmentAbsorber
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")

# Cerca testo
document.pages.accept(txtAbsorber)

# Ottieni riferimento ai frammenti di testo trovati
textFragmentCollection = txtAbsorber.text_fragments

# Analizza tutti i frammenti di testo cercati e sostituisci il testo
for txtFragment in textFragmentCollection:
    txtFragment.text = "replaced-text"

# Salva il PDF aggiornato
document.save("output.pdf")

Strumento online per sostituire il testo in PDF

Abbiamo anche sviluppato uno strumento online per sostituire il testo nei file PDF, basato su Aspose.PDF for Python. Puoi utilizzare questo strumento da qualsiasi luogo in qualsiasi momento solo con una connessione Internet.

Libreria Python gratuita per sostituire il testo in PDF

Puoi ottenere una licenza temporanea gratuita e sostituire il testo nei file PDF senza alcuna limitazione.

Inoltre, puoi esplorare altre funzionalità della libreria Python PDF utilizzando la documentazione. Inoltre, scrivici sul nostro forum in merito ai tuoi problemi, suggerimenti o feedback.

Conclusione

In questo articolo, hai imparato come analizzare un PDF e trovare e sostituire un particolare testo usando Python. In poche righe di codice, puoi cercare e sostituire il testo in un batch di file PDF. Inoltre, ti abbiamo fornito uno strumento online gratuito per sostituire il testo nei file PDF. Puoi utilizzare questo strumento da qualsiasi dispositivo dotato di connessione Internet.

Guarda anche