Python menemukan dan mengganti teks dalam PDF

Jika Anda mencari cara sederhana namun akurat untuk menemukan dan mengganti teks dalam file PDF, Anda telah datang ke tempat yang tepat. Pada artikel ini, Anda akan mempelajari cara mengganti teks tertentu dalam PDF menggunakan Python. Dengan menulis beberapa baris kode, Anda dapat mengurai seluruh PDF untuk mencari dan mengganti kata/frasa yang diinginkan.

Perpustakaan Python untuk Menemukan dan Mengganti Teks dalam PDF

Untuk mencari dan mengganti teks dalam file PDF, kita akan menggunakan Aspose.PDF for Python. Ini adalah perpustakaan Python yang kuat untuk membuat dan memproses file PDF dengan mudah. Perpustakaan juga memungkinkan Anda menemukan dan mengganti teks dalam file PDF dengan akurasi dan kecepatan tinggi.

Untuk menginstal perpustakaan, Anda dapat menggunakan perintah pip berikut.

> pip install aspose-pdf

Temukan dan Ganti Teks dalam PDF menggunakan Python

Langkah-langkah berikut menjelaskan cara mencari dan mengganti teks dalam dokumen PDF menggunakan Python dengan bantuan Aspose.PDF.

  1. Muat PDF dari jalurnya menggunakan kelas Document.
  2. Buat instance kelas TextFragmentAbsorber dan berikan frasa penelusuran ke konstruktornya.
  3. Terima penyerap teks untuk semua halaman PDF menggunakan doc.pages.accept(textabsorber).
  4. Dapatkan fragmen teks yang diekstraksi menjadi objek.
  5. Ulangi fragmen teks yang ditemukan dan ganti teks di setiap fragmen.
  6. Terakhir, simpan dokumen PDF yang diperbarui menggunakan metode Document.save().

Contoh kode berikut menunjukkan cara menemukan dan mengganti teks dalam PDF menggunakan Python.

# Muat dokumen PDF
document = ap.Document("input.pdf")

# Membuat instance objek TextFragmentAbsorber
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")

# Cari teks
document.pages.accept(txtAbsorber)

# Dapatkan referensi ke fragmen teks yang ditemukan
textFragmentCollection = txtAbsorber.text_fragments

# Parsing semua fragmen teks yang dicari dan ganti teks
for txtFragment in textFragmentCollection:
    txtFragment.text = "replaced-text"

# Simpan PDF yang diperbarui
document.save("output.pdf")

Alat Online untuk Mengganti Teks dalam PDF

Kami juga telah mengembangkan fitur online untuk mengganti teks dalam file PDF, yang didasarkan pada Aspose.PDF for Python. Anda dapat menggunakan alat ini dari mana saja kapan saja hanya memiliki koneksi internet.

Pustaka Python Gratis untuk Mengganti Teks dalam PDF

Anda dapat mendapatkan lisensi sementara gratis dan mengganti teks dalam file PDF tanpa batasan apa pun.

Selain itu, Anda dapat menjelajahi fitur lain dari pustaka Python PDF menggunakan dokumentasi. Selain itu, kirimkan email kepada kami di forum kami tentang masalah, saran, atau masukan Anda.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengurai PDF dan menemukan serta mengganti teks tertentu menggunakan Python. Dalam beberapa baris kode, Anda dapat mencari dan mengganti teks dalam sekumpulan file PDF. Selain itu, kami telah memberi Anda alat online gratis untuk mengganti teks dalam file PDF. Anda dapat menggunakan alat ini dari perangkat apa pun yang memiliki koneksi internet.

Lihat juga