Om du letar efter ett enkelt men korrekt sätt att hitta och ersätta text i PDF-filer, har du kommit till rätt plats. I den här artikeln kommer du att lära dig hur du ersätter en viss text i en PDF med Python. Genom att skriva några rader kod kan du analysera hela PDF-filen för att söka och ersätta önskade ord/fraser.
- Python-bibliotek för att hitta och ersätta text i PDF
- Hitta och ersätt text i PDF med Python
- Onlineverktyg för att ersätta text i Python
Python-bibliotek för att hitta och ersätta text i PDF
För att hitta och ersätta text i PDF-filer kommer vi att använda Aspose.PDF for Python. Det är ett robust Python-bibliotek för att skapa och bearbeta PDF-filer utan ansträngning. Biblioteket gör det också möjligt för dig att hitta och ersätta text i PDF-filer med hög noggrannhet och snabbhet.
För att installera biblioteket kan du använda följande pip-kommando.
> pip install aspose-pdf
Hitta och ersätt text i PDF med Python
Följande steg förklarar hur du hittar och ersätter text i ett PDF-dokument med Python med hjälp av Aspose.PDF.
- Ladda PDF-filen från dess sökväg med Document class.
- Skapa en instans av klassen TextFragmentAbsorber och tillhandahåll sökfrasen till dess konstruktor.
- Acceptera textabsorberaren för alla sidor i PDF:en med doc.pages.accept(textabsorber).
- Få de extraherade textfragmenten till ett objekt.
- Gå igenom de hittade textfragmenten och ersätt text i varje fragment.
- Slutligen sparar du det uppdaterade PDF-dokumentet med metoden Document.save().
Följande kodexempel visar hur du hittar och ersätter text i PDF med Python.
# Ladda PDF-dokumentet
document = ap.Document("input.pdf")
# Instantiera ett TextFragmentAbsorber-objekt
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")
# Sök text
document.pages.accept(txtAbsorber)
# Få referens till de hittade textfragmenten
textFragmentCollection = txtAbsorber.text_fragments
# Analysera alla sökta textfragment och ersätt text
for txtFragment in textFragmentCollection:
txtFragment.text = "replaced-text"
# Spara den uppdaterade PDF-filen
document.save("output.pdf")
Onlineverktyg för att ersätta text i PDF
Vi har också utvecklat ett onlineverktyg för att ersätta text i PDF-filer, som är baserat på Aspose.PDF för Python. Du kan använda det här verktyget var som helst när som helst bara med en internetanslutning.
Gratis Python-bibliotek för att ersätta text i PDF
Du kan skaffa en gratis tillfällig licens och ersätta text i PDF-filer utan några begränsningar.
Dessutom kan du utforska andra funktioner i Python PDF-biblioteket med hjälp av dokumentationen. Skriv också till oss på vårt forum om dina problem, förslag eller feedback.
Slutsats
I den här artikeln har du lärt dig att analysera en PDF och hitta och ersätta en viss text med Python. På några rader kod kan du söka och ersätta text i en sats av PDF-filer. Dessutom har vi försett dig med ett gratis onlineverktyg för att ersätta text i PDF-filer. Du kan använda det här verktyget från vilken enhet som helst som har en internetanslutning.