Konversi PDF ke Word dengan Python

PDF adalah format file yang umum digunakan untuk berbagi dan mencetak dokumen. Namun, dalam kasus tertentu, file PDF dikonversi ke format Word DOCX atau DOC untuk mengurai teks atau membuat dokumen dapat diedit. Untuk skenario seperti itu, artikel ini membahas cara mengonversi format PDF ke Word dengan Python. Selain itu, Anda akan belajar cara menentukan opsi pemuatan yang berbeda untuk mengontrol konversi PDF ke Word.

Python PDF to Word Converter - Unduhan Gratis

Untuk mengonversi file PDF ke format Word, kami akan menggunakan Aspose.Words for Python. Ini adalah pustaka Python yang kaya fitur untuk membuat, memanipulasi, dan mengonversi dokumen Word. Selain itu, ia menyediakan konversi bolak-balik dokumen Word dan PDF dengan ketelitian tinggi. Aspose.Words for Python dihosting di PyPI dan dapat diinstal menggunakan perintah pip berikut.

pip install aspose-words

Langkah Mudah Mengonversi PDF ke Word dengan Python

Menggunakan Aspose.Words for Python, Anda dapat mengonversi file PDF ke format Word dalam beberapa langkah. Cukup muat file PDF dan simpan sebagai dokumen Word. Langkah-langkah berikut menunjukkan cara menyimpan PDF dalam dokumen Word dengan Python.

  • Muat dokumen PDF dari disk.
  • Simpan dokumen Word sebagai PDF ke lokasi yang diinginkan.

Dan itu saja. Bagian berikut menunjukkan cara mengubah langkah-langkah ini menjadi kode Python untuk mengonversi format PDF ke Word.

Simpan PDF sebagai Format Word dengan Python

Berikut ini adalah langkah-langkah untuk menyimpan file PDF sebagai format Word dengan Python.

  • Muat file PDF menggunakan kelas Document.
  • Simpan file PDF sebagai dokumen Word menggunakan metode Document.save().

Contoh kode berikut menunjukkan cara mengonversi file PDF ke format Word.

import aspose.words as aw

# memuat file PDF
doc = aw.Document("PDF.pdf")

# mengonversi format PDF ke Word DOCX
doc.save("pdf-to-word.docx")

Python Konversi PDF ke Word dengan Opsi Muat

Aspose.Words for Python juga memungkinkan Anda menyesuaikan pemuatan dokumen PDF sesuai kebutuhan Anda. Misalnya, Anda hanya dapat memuat rentang halaman dalam PDF, melewati gambar, menentukan kata sandi untuk file terenkripsi, dll. Untuk mengatur opsi muat, kelas PdfLoadOptions digunakan. Berikut ini adalah langkah-langkah untuk menentukan opsi muat dalam konversi PDF ke Word.

  • Buat instance kelas PdfLoadOptions.
  • Tentukan format pemuatan menggunakan properti PdfLoadOptions.loadformat.
  • Tetapkan opsi seperti skippdfimages, pageindex, pagecount, dll.
  • Gunakan kelas Document untuk memuat file PDF dengan meneruskan jalurnya dan PdfLoadOptions sebagai parameter.
  • Simpan file PDF sebagai dokumen Word menggunakan metode Document.save().

Contoh kode berikut menunjukkan cara menentukan opsi muat dalam konversi PDF ke Word dengan Python.

import aspose.words as aw

# buat opsi pemuatan PDF
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# atur indeks halaman awal dan jumlah halaman
loadOptions.page_index = 0
loadOptions.page_count = 1

# lewati gambar dalam PDF
loadOptions.skip_pdf_images = True

# untuk mengatur kata sandi untuk file PDF terenkripsi
#loadOptions.password = "12345" 

# memuat file PDF
doc = aw.Document("PDF.pdf", loadOptions)

# konversi PDF ke Word
doc.save("pdf-to-word.docx")

Python PDF to Word Library - Dapatkan Lisensi Gratis

Anda bisa mendapatkan lisensi sementara untuk menggunakan Aspose.Words for Python tanpa batasan evaluasi.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengonversi file PDF ke format Word dengan Python. Selain itu, Anda telah melihat cara menentukan opsi pemuatan yang berbeda untuk file PDF secara dinamis. Aspose.Words for Python menyediakan berbagai fitur lain yang dapat Anda jelajahi menggunakan dokumentasi. Selain itu, Anda dapat mengajukan pertanyaan melalui forum kami.

Lihat juga

Konversi File Word ke PDF menggunakan PythonBuat Dokumen Word dengan Python tanpa MS OfficePNG ke Word dalam C# .NET
JPG ke Word dalam C# .NETGambar ke Kata dalam C#Word to HTML in C#
Word DOCX ke Markdown di JavaEkstrak Gambar dari Word DOC di JavaWord DOC ke Markdown di Java
Word DOC DOCX menjadi Markdown di C#Ekstrak Teks dari Dokumen Word di JavaGabungkan Dokumen MS Word menggunakan C# .NET
Word DOC ke PNG, JPEG, BMP, GIF, atau TIFF dalam C#Word DOC ke PNG, JPEG, BMP, GIF, atau TIFF di JavaKonversi Dokumen Word ke EPUB di C#
Konversi Dokumen Word ke EPUB di JavaKonversi Dokumen Word ke EPUB dengan PythonUbah RTF ke PDF menggunakan Python
Konversi File TXT ke PDF dalam C#Konversi File TXT ke PDF di JavaKonversi File TXT ke PDF dengan Python