Python trouve et remplace du texte dans un PDF

Si vous recherchez un moyen simple mais précis de rechercher et de remplacer du texte dans des fichiers PDF, vous êtes au bon endroit. Dans cet article, vous apprendrez à remplacer un texte particulier dans un PDF à l’aide de Python. En écrivant quelques lignes de code, vous pouvez analyser l’intégralité du PDF pour rechercher et remplacer les mots/phrases souhaités.

Bibliothèque Python pour rechercher et remplacer du texte dans un PDF

Pour rechercher et remplacer du texte dans des fichiers PDF, nous utiliserons Aspose.PDF for Python. Il s’agit d’une bibliothèque Python robuste pour créer et traiter des fichiers PDF sans effort. La bibliothèque vous permet également de rechercher et de remplacer du texte dans des fichiers PDF avec une précision et une rapidité élevées.

Pour installer la bibliothèque, vous pouvez utiliser la commande pip suivante.

> pip install aspose-pdf

Rechercher et remplacer du texte dans un PDF à l’aide de Python

Les étapes suivantes expliquent comment rechercher et remplacer du texte dans un document PDF à l’aide de Python à l’aide d’Aspose.PDF.

  1. Chargez le PDF à partir de son chemin à l’aide de la classe Document.
  2. Créez une instance de la classe TextFragmentAbsorber et fournissez la phrase de recherche à son constructeur.
  3. Acceptez l’absorbeur de texte pour toutes les pages du PDF en utilisant doc.pages.accept(textabsorber).
  4. Obtenez les fragments de texte extraits dans un objet.
  5. Parcourez les fragments de texte trouvés et remplacez le texte dans chaque fragment.
  6. Enfin, enregistrez le document PDF mis à jour à l’aide de la méthode Document.save().

L’exemple de code suivant montre comment rechercher et remplacer du texte dans un PDF à l’aide de Python.

# Charger le document PDF
document = ap.Document("input.pdf")

# Instancier un objet TextFragmentAbsorber
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")

# Texte de recherche
document.pages.accept(txtAbsorber)

# Obtenir une référence aux fragments de texte trouvés
textFragmentCollection = txtAbsorber.text_fragments

# Analyser tous les fragments de texte recherchés et remplacer le texte
for txtFragment in textFragmentCollection:
    txtFragment.text = "replaced-text"

# Enregistrer le PDF mis à jour
document.save("output.pdf")

Outil en ligne pour remplacer du texte dans un PDF

Nous avons également développé un outil en ligne pour remplacer du texte dans des fichiers PDF, basé sur Aspose.PDF for Python. Vous pouvez utiliser cet outil de n’importe où, n’importe quand, uniquement avec une connexion Internet.

Bibliothèque Python gratuite pour remplacer du texte dans un PDF

Vous pouvez obtenir une licence temporaire gratuite et remplacer du texte dans des fichiers PDF sans aucune limitation.

De plus, vous pouvez explorer d’autres fonctionnalités de la bibliothèque Python PDF à l’aide de la documentation. Ecrivez-nous également sur notre forum pour nous faire part de vos problèmes, suggestions ou commentaires.

Conclusion

Dans cet article, vous avez appris à analyser un PDF et à rechercher et remplacer un texte particulier à l’aide de Python. En quelques lignes de code, vous pouvez rechercher et remplacer du texte dans un lot de fichiers PDF. De plus, nous vous avons fourni un outil en ligne gratuit pour remplacer le texte dans les fichiers PDF. Vous pouvez utiliser cet outil à partir de n’importe quel appareil disposant d’une connexion Internet.

Voir également