Python hitta och ersätt text i PDF

Om du letar efter ett enkelt men korrekt sätt att hitta och ersätta text i PDF-filer, har du kommit till rätt plats. I den här artikeln kommer du att lära dig hur du ersätter en viss text i en PDF med Python. Genom att skriva några rader kod kan du analysera hela PDF-filen för att söka och ersätta önskade ord/fraser.

Python-bibliotek för att hitta och ersätta text i PDF

För att hitta och ersätta text i PDF-filer kommer vi att använda Aspose.PDF for Python. Det är ett robust Python-bibliotek för att skapa och bearbeta PDF-filer utan ansträngning. Biblioteket gör det också möjligt för dig att hitta och ersätta text i PDF-filer med hög noggrannhet och snabbhet.

För att installera biblioteket kan du använda följande pip-kommando.

> pip install aspose-pdf

Hitta och ersätt text i PDF med Python

Följande steg förklarar hur du hittar och ersätter text i ett PDF-dokument med Python med hjälp av Aspose.PDF.

  1. Ladda PDF-filen från dess sökväg med Document class.
  2. Skapa en instans av klassen TextFragmentAbsorber och tillhandahåll sökfrasen till dess konstruktor.
  3. Acceptera textabsorberaren för alla sidor i PDF:en med doc.pages.accept(textabsorber).
  4. Få de extraherade textfragmenten till ett objekt.
  5. Gå igenom de hittade textfragmenten och ersätt text i varje fragment.
  6. Slutligen sparar du det uppdaterade PDF-dokumentet med metoden Document.save().

Följande kodexempel visar hur du hittar och ersätter text i PDF med Python.

# Ladda PDF-dokumentet
document = ap.Document("input.pdf")

# Instantiera ett TextFragmentAbsorber-objekt
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")

# Sök text
document.pages.accept(txtAbsorber)

# Få referens till de hittade textfragmenten
textFragmentCollection = txtAbsorber.text_fragments

# Analysera alla sökta textfragment och ersätt text
for txtFragment in textFragmentCollection:
    txtFragment.text = "replaced-text"

# Spara den uppdaterade PDF-filen
document.save("output.pdf")

Onlineverktyg för att ersätta text i PDF

Vi har också utvecklat ett onlineverktyg för att ersätta text i PDF-filer, som är baserat på Aspose.PDF för Python. Du kan använda det här verktyget var som helst när som helst bara med en internetanslutning.

Gratis Python-bibliotek för att ersätta text i PDF

Du kan skaffa en gratis tillfällig licens och ersätta text i PDF-filer utan några begränsningar.

Dessutom kan du utforska andra funktioner i Python PDF-biblioteket med hjälp av dokumentationen. Skriv också till oss på vårt forum om dina problem, förslag eller feedback.

Slutsats

I den här artikeln har du lärt dig att analysera en PDF och hitta och ersätta en viss text med Python. På några rader kod kan du söka och ersätta text i en sats av PDF-filer. Dessutom har vi försett dig med ett gratis onlineverktyg för att ersätta text i PDF-filer. Du kan använda det här verktyget från vilken enhet som helst som har en internetanslutning.

Se även