Python znajdź i zamień tekst w formacie PDF

Jeśli szukasz prostego, ale dokładnego sposobu znajdowania i zastępowania tekstu w plikach PDF, trafiłeś we właściwe miejsce. W tym artykule dowiesz się, jak zamienić określony tekst w pliku PDF za pomocą Python. Pisząc kilka linii kodu, możesz przeanalizować cały plik PDF, aby wyszukać i zamienić żądane słowa/frazy.

Biblioteka Python do znajdowania i zastępowania tekstu w formacie PDF

Aby znaleźć i zamienić tekst w plikach PDF, użyjemy Aspose.PDF for Python. Jest to solidna biblioteka Python do bezproblemowego tworzenia i przetwarzania plików PDF. Biblioteka umożliwia również znajdowanie i zastępowanie tekstu w plikach PDF z dużą dokładnością i szybkością.

Aby zainstalować bibliotekę, możesz użyć następującego polecenia pip.

> pip install aspose-pdf

Znajdź i zamień tekst w pliku PDF za pomocą Python

Poniższe kroki wyjaśniają, jak znaleźć i zamienić tekst w dokumencie PDF za pomocą Python z pomocą Aspose.PDF.

  1. Załaduj plik PDF ze ścieżki, używając klasy Document.
  2. Utwórz instancję klasy TextFragmentAbsorber i podaj wyszukiwaną frazę jej konstruktorowi.
  3. Zaakceptuj absorber tekstu dla wszystkich stron pliku PDF za pomocą doc.pages.accept(textabsorber).
  4. Pobierz wyodrębnione fragmenty tekstu do obiektu.
  5. Przejrzyj znalezione fragmenty tekstu i zamień tekst w każdym fragmencie.
  6. Na koniec zapisz zaktualizowany dokument PDF za pomocą metody Document.save().

Poniższy przykładowy kod pokazuje, jak znaleźć i zamienić tekst w pliku PDF przy użyciu języka Python.

# Załaduj dokument PDF
document = ap.Document("input.pdf")

# Utwórz instancję obiektu TextFragmentAbsorber
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")

# Wyszukaj tekst
document.pages.accept(txtAbsorber)

# Uzyskaj odniesienie do znalezionych fragmentów tekstu
textFragmentCollection = txtAbsorber.text_fragments

# Przeanalizuj wszystkie wyszukane fragmenty tekstu i zamień tekst
for txtFragment in textFragmentCollection:
    txtFragment.text = "replaced-text"

# Zapisz zaktualizowany plik PDF
document.save("output.pdf")

Narzędzie online do zastępowania tekstu w formacie PDF

Opracowaliśmy również narzędzie online do zastępowania tekstu w plikach PDF, które jest oparte na Aspose.PDF for Python. Możesz korzystać z tego narzędzia w dowolnym miejscu i czasie, mając tylko połączenie z Internetem.

Bezpłatna biblioteka Python do zastępowania tekstu w formacie PDF

Możesz uzyskać bezpłatną tymczasową licencję i zastępować tekst w plikach PDF bez żadnych ograniczeń.

Ponadto możesz zapoznać się z innymi funkcjami biblioteki Python PDF za pomocą dokumentacji. Napisz też do nas na naszym forum o swoich problemach, sugestiach lub opiniach.

Wniosek

W tym artykule nauczyłeś się analizować plik PDF oraz znajdować i zastępować określony tekst za pomocą Python. Wystarczy kilka wierszy kodu, aby wyszukać i zamienić tekst w serii plików PDF. Dodatkowo udostępniliśmy Ci darmowe narzędzie online do zamiany tekstu w plikach PDF. Możesz korzystać z tego narzędzia z dowolnego urządzenia z dostępem do Internetu.

Zobacz też