Jeśli szukasz prostego, ale dokładnego sposobu znajdowania i zastępowania tekstu w plikach PDF, trafiłeś we właściwe miejsce. W tym artykule dowiesz się, jak zamienić określony tekst w pliku PDF za pomocą Python. Pisząc kilka linii kodu, możesz przeanalizować cały plik PDF, aby wyszukać i zamienić żądane słowa/frazy.
- Biblioteka Python do znajdowania i zastępowania tekstu w formacie PDF
- Znajdź i zamień tekst w pliku PDF za pomocą Python
- Narzędzie online do zastępowania tekstu w Python
Biblioteka Python do znajdowania i zastępowania tekstu w formacie PDF
Aby znaleźć i zamienić tekst w plikach PDF, użyjemy Aspose.PDF for Python. Jest to solidna biblioteka Python do bezproblemowego tworzenia i przetwarzania plików PDF. Biblioteka umożliwia również znajdowanie i zastępowanie tekstu w plikach PDF z dużą dokładnością i szybkością.
Aby zainstalować bibliotekę, możesz użyć następującego polecenia pip.
> pip install aspose-pdf
Znajdź i zamień tekst w pliku PDF za pomocą Python
Poniższe kroki wyjaśniają, jak znaleźć i zamienić tekst w dokumencie PDF za pomocą Python z pomocą Aspose.PDF.
- Załaduj plik PDF ze ścieżki, używając klasy Document.
- Utwórz instancję klasy TextFragmentAbsorber i podaj wyszukiwaną frazę jej konstruktorowi.
- Zaakceptuj absorber tekstu dla wszystkich stron pliku PDF za pomocą doc.pages.accept(textabsorber).
- Pobierz wyodrębnione fragmenty tekstu do obiektu.
- Przejrzyj znalezione fragmenty tekstu i zamień tekst w każdym fragmencie.
- Na koniec zapisz zaktualizowany dokument PDF za pomocą metody Document.save().
Poniższy przykładowy kod pokazuje, jak znaleźć i zamienić tekst w pliku PDF przy użyciu języka Python.
# Załaduj dokument PDF
document = ap.Document("input.pdf")
# Utwórz instancję obiektu TextFragmentAbsorber
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")
# Wyszukaj tekst
document.pages.accept(txtAbsorber)
# Uzyskaj odniesienie do znalezionych fragmentów tekstu
textFragmentCollection = txtAbsorber.text_fragments
# Przeanalizuj wszystkie wyszukane fragmenty tekstu i zamień tekst
for txtFragment in textFragmentCollection:
txtFragment.text = "replaced-text"
# Zapisz zaktualizowany plik PDF
document.save("output.pdf")
Narzędzie online do zastępowania tekstu w formacie PDF
Opracowaliśmy również narzędzie online do zastępowania tekstu w plikach PDF, które jest oparte na Aspose.PDF for Python. Możesz korzystać z tego narzędzia w dowolnym miejscu i czasie, mając tylko połączenie z Internetem.
Bezpłatna biblioteka Python do zastępowania tekstu w formacie PDF
Możesz uzyskać bezpłatną tymczasową licencję i zastępować tekst w plikach PDF bez żadnych ograniczeń.
Ponadto możesz zapoznać się z innymi funkcjami biblioteki Python PDF za pomocą dokumentacji. Napisz też do nas na naszym forum o swoich problemach, sugestiach lub opiniach.
Wniosek
W tym artykule nauczyłeś się analizować plik PDF oraz znajdować i zastępować określony tekst za pomocą Python. Wystarczy kilka wierszy kodu, aby wyszukać i zamienić tekst w serii plików PDF. Dodatkowo udostępniliśmy Ci darmowe narzędzie online do zamiany tekstu w plikach PDF. Możesz korzystać z tego narzędzia z dowolnego urządzenia z dostępem do Internetu.