Python najít a nahradit text v PDF

Pokud hledáte jednoduchý, ale přesný způsob, jak najít a nahradit text v souborech PDF, jste na správném místě. V tomto článku se dozvíte, jak nahradit konkrétní text v PDF pomocí Python. Napsáním několika řádků kódu můžete analyzovat celý PDF a hledat a nahrazovat požadovaná slova/fráze.

Knihovna Python pro hledání a nahrazování textu v PDF

K vyhledání a nahrazení textu v souborech PDF použijeme Aspose.PDF for Python. Jedná se o robustní knihovnu Python pro snadné vytváření a zpracování souborů PDF. Knihovna také umožňuje vyhledávat a nahrazovat text v souborech PDF s vysokou přesností a rychlostí.

K instalaci knihovny můžete použít následující příkaz pip.

> pip install aspose-pdf

Najít a nahradit text v PDF pomocí Python

Následující kroky vysvětlují, jak najít a nahradit text v dokumentu PDF pomocí Python s pomocí Aspose.PDF.

  1. Načtěte PDF z jeho cesty pomocí třídy Document.
  2. Vytvořte instanci třídy TextFragmentAbsorber a poskytněte hledanou frázi jejímu konstruktoru.
  3. Přijměte absorbér textu pro všechny stránky PDF pomocí doc.pages.accept(textabsorber).
  4. Získejte extrahované fragmenty textu do objektu.
  5. Procházejte nalezené fragmenty textu a nahraďte text v každém fragmentu.
  6. Nakonec uložte aktualizovaný dokument PDF pomocí metody Document.save().

Následující ukázka kódu ukazuje, jak najít a nahradit text v PDF pomocí Python.

# Načtěte dokument PDF
document = ap.Document("input.pdf")

# Vytvořte instanci objektu TextFragmentAbsorber
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")

# Hledat text
document.pages.accept(txtAbsorber)

# Získejte odkaz na nalezené fragmenty textu
textFragmentCollection = txtAbsorber.text_fragments

# Analyzujte všechny hledané části textu a nahraďte text
for txtFragment in textFragmentCollection:
    txtFragment.text = "replaced-text"

# Uložte aktualizované PDF
document.save("output.pdf")

Online nástroj pro nahrazení textu v PDF

Vyvinuli jsme také online nástroj pro nahrazení textu v souborech PDF, který je založen na Aspose.PDF for Python. Tento nástroj můžete používat odkudkoli a kdykoli pouze s připojením k internetu.

Bezplatná knihovna Python pro nahrazení textu v PDF

Můžete získat bezplatnou dočasnou licenci a nahrazovat text v souborech PDF bez jakýchkoli omezení.

Kromě toho můžete prozkoumat další funkce knihovny PDF Python pomocí dokumentace. Také nám napište na naše fórum ohledně svých problémů, návrhů nebo zpětné vazby.

Závěr

V tomto článku jste se naučili, jak analyzovat PDF a najít a nahradit konkrétní text pomocí Python. V několika řádcích kódu můžete vyhledávat a nahrazovat text v dávce souborů PDF. Kromě toho jsme vám poskytli bezplatný online nástroj pro nahrazení textu v souborech PDF. Tento nástroj můžete používat z jakéhokoli zařízení s připojením k internetu.

Viz také