Konversi PDF ke Word dengan Python

PDF adalah format file yang umum digunakan untuk berbagi dan mencetak dokumen. Namun, dalam kasus tertentu, file PDF dikonversi ke format Word DOCX untuk mengurai teks atau membuat dokumen dapat diedit. Untuk skenario seperti itu, artikel ini membahas cara mengonversi PDF ke DOCX dengan Python. Selain itu, Anda akan mempelajari cara menentukan opsi pemuatan yang berbeda untuk mengontrol pemuatan file PDF secara dinamis.

Konverter PDF ke DOCX Python - Unduhan Gratis

Untuk mengonversi file PDF ke format DOCX, kami akan menggunakan Aspose.Words for Python. Ini adalah pustaka Python yang kaya fitur untuk membuat, memanipulasi, dan mengonversi dokumen Word. Selain itu, ia menyediakan konversi bolak-balik dokumen Word dan PDF dengan ketelitian tinggi. Aspose.Words for Python dihosting di PyPI dan dapat diinstal menggunakan perintah pip berikut.

pip install aspose-words

Konversi PDF ke DOCX dengan Python

Menggunakan Aspose.Words for Python, Anda dapat mengonversi file PDF ke DOCX dalam beberapa langkah. Cukup muat file PDF dan simpan sebagai dokumen DOCX. Berikut ini adalah langkah-langkah untuk mengonversi PDF ke DOCX dengan Python.

  • Muat file PDF menggunakan kelas Document.
  • Simpan file PDF sebagai dokumen DOCX menggunakan metode Document.save().

Contoh kode berikut menunjukkan cara mengonversi file PDF ke format DOCX.

import aspose.words as aw

# memuat file PDF
doc = aw.Document("PDF.pdf")

# mengonversi format PDF ke Word DOCX
doc.save("pdf-to-word.docx")

Konversi Python PDF ke DOCX - Tentukan Opsi Muat

Aspose.Words for Python juga memungkinkan Anda menyesuaikan pemuatan dokumen PDF sesuai kebutuhan Anda. Misalnya, Anda hanya dapat memuat rentang halaman dalam PDF, melewati gambar, menentukan kata sandi untuk file terenkripsi, dll. Untuk mengatur opsi muat, kelas PdfLoadOptions digunakan. Berikut ini adalah langkah-langkah untuk menentukan opsi muat dalam konversi Python PDF ke DOCX.

  • Buat instance kelas PdfLoadOptions.
  • Tentukan format pemuatan menggunakan properti PdfLoadOptions.loadformat.
  • Tetapkan opsi seperti skippdfimages, pageindex, pagecount, dll.
  • Gunakan kelas Document untuk memuat file PDF dengan meneruskan jalurnya dan PdfLoadOptions sebagai parameter.
  • Simpan file PDF sebagai dokumen DOCX menggunakan metode Document.save().

Contoh kode berikut menunjukkan cara menentukan opsi muat dalam konversi PDF ke DOCX dengan Python.

import aspose.words as aw

# buat opsi pemuatan PDF
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# atur indeks halaman awal dan jumlah halaman
loadOptions.page_index = 0
loadOptions.page_count = 1

# lewati gambar dalam PDF
loadOptions.skip_pdf_images = True

# untuk mengatur kata sandi untuk file PDF terenkripsi
#loadOptions.password = "12345" 

# memuat file PDF
doc = aw.Document("PDF.pdf", loadOptions)

# konversi PDF ke Word
doc.save("pdf-to-word.docx")

Python PDF to DOCX Converter - Dapatkan Lisensi Gratis

Anda bisa mendapatkan lisensi sementara untuk menggunakan Aspose.Words for Python tanpa batasan evaluasi.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengonversi file PDF ke DOCX dengan Python. Selain itu, Anda telah melihat cara menentukan opsi pemuatan yang berbeda untuk file PDF secara dinamis. Aspose.Words for Python menyediakan berbagai fitur lain yang dapat Anda jelajahi menggunakan dokumentasi. Selain itu, Anda dapat mengajukan pertanyaan melalui forum kami.

Lihat juga