Python sucht und ersetzt Text in PDF

Wenn Sie nach einer einfachen und dennoch präzisen Möglichkeit suchen, Text in PDF Dateien zu finden und zu ersetzen, sind Sie hier genau richtig. In diesem Artikel erfahren Sie, wie Sie mit Python einen bestimmten Text in einer PDF-Datei ersetzen. Durch das Schreiben einiger Codezeilen können Sie das gesamte PDF analysieren, um die gewünschten Wörter/Phrasen zu suchen und zu ersetzen.

Python Bibliothek zum Suchen und Ersetzen von Text in PDF

Um Text in PDF Dateien zu suchen und zu ersetzen, verwenden wir Aspose.PDF for Python. Es handelt sich um eine robuste Python Bibliothek zum mühelosen Erstellen und Verarbeiten von PDF Dateien. Mit der Bibliothek können Sie außerdem Text in PDF Dateien mit hoher Genauigkeit und Geschwindigkeit suchen und ersetzen.

Um die Bibliothek zu installieren, können Sie den folgenden pip-Befehl verwenden.

> pip install aspose-pdf

Suchen und ersetzen Sie Text in PDF mit Python

Die folgenden Schritte erklären, wie Sie mithilfe von Aspose.PDF Text in einem PDF Dokument mit Python suchen und ersetzen.

  1. Laden Sie die PDF-Datei mithilfe der Document Klasse aus ihrem Pfad.
  2. Erstellen Sie eine Instanz der TextFragmentAbsorber Klasse und stellen Sie dem Konstruktor den Suchbegriff zur Verfügung.
  3. Akzeptieren Sie den Textabsorber für alle Seiten der PDF-Datei mit doc.pages.accept(textabsorber).
  4. Holen Sie sich die extrahierten Textfragmente in ein Objekt.
  5. Durchlaufen Sie die gefundenen Textfragmente und ersetzen Sie den Text in jedem Fragment.
  6. Speichern Sie abschließend das aktualisierte PDF Dokument mit der Methode Document.save().

Das folgende Codebeispiel zeigt, wie Sie mit Python Text in PDF suchen und ersetzen.

# Laden Sie das PDF Dokument
document = ap.Document("input.pdf")

# Instanziieren Sie ein TextFragmentAbsorber Objekt
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")

# Suchtext
document.pages.accept(txtAbsorber)

# Verweisen Sie auf die gefundenen Textfragmente
textFragmentCollection = txtAbsorber.text_fragments

# Analysieren Sie alle gesuchten Textfragmente und ersetzen Sie den Text
for txtFragment in textFragmentCollection:
    txtFragment.text = "replaced-text"

# Speichern Sie das aktualisierte PDF
document.save("output.pdf")

Online-Tool zum Ersetzen von Text in PDF

Wir haben außerdem ein Online-Tool zum Ersetzen von Text in PDF Dateien entwickelt, das auf Aspose.PDF for Python basiert. Sie können dieses Tool jederzeit und überall verwenden, wenn Sie nur über eine Internetverbindung verfügen.

Kostenlose Python Bibliothek zum Ersetzen von Text in PDF

Sie können eine kostenlose temporäre Lizenz erwerben und Text in PDF Dateien ohne Einschränkungen ersetzen.

Darüber hinaus können Sie mithilfe der Dokumentation weitere Funktionen der Python-PDF-Bibliothek erkunden. Schreiben Sie uns auch in unserem Forum über Ihre Probleme, Vorschläge oder Ihr Feedback.

Abschluss

In diesem Artikel haben Sie erfahren, wie Sie mit Python ein PDF analysieren und einen bestimmten Text suchen und ersetzen. Mit wenigen Codezeilen können Sie Text in einem Stapel von PDF Dateien suchen und ersetzen. Darüber hinaus haben wir Ihnen ein kostenloses Online-Tool zum Ersetzen von Text in PDF Dateien zur Verfügung gestellt. Sie können dieses Tool von jedem Gerät aus verwenden, das über eine Internetverbindung verfügt.

Siehe auch