Konversikan Word ke JSON dengan Python

Dalam berbagai kasus, Anda harus melakukan konversi Word ke JSON secara terprogram dari dalam aplikasi Python Anda. Misalnya, untuk mengekspor data dari dokumen Word dan memproses atau memindahkannya dalam format JSON. Pada artikel ini, Anda akan mempelajari cara mudah mengonversi teks dalam dokumen Word ke format JSON. Selanjutnya, Anda akan belajar cara memuat dokumen Word yang dilindungi dan mengonversinya menjadi JSON secara terprogram. Jadi mari lanjutkan untuk mengonversi Word ke JSON dengan Python.

Cara Mengonversi Word ke JSON dengan Python

Untuk mengonversi dokumen Word ke format JSON, kami akan melakukan langkah-langkah berikut:

  • Muat dokumen Word.
  • Konversikan ke format HTML.
  • Simpan file HTML dalam format JSON.

Mari kita lihat bagaimana mengimplementasikan langkah-langkah ini secara terprogram dengan Python. Untuk ini, pertama-tama kita akan menginstal beberapa pustaka, seperti yang ditunjukkan di bagian berikut.

Perpustakaan Python untuk Mengonversi Word ke JSON - Unduhan Gratis

Aspose.Words for Python adalah pustaka tangguh yang dirancang untuk membuat dan memproses dokumen MS Word. Kami akan menggunakan perpustakaan ini untuk mengekspor konten dokumen Word ke HTML. Setelah kita memiliki konten HTML, kita akan menggunakan Aspose.Cells for Python untuk menyimpannya sebagai file JSON.

Anda dapat menggunakan perintah pip berikut untuk menginstal kedua pustaka.

pip install aspose-cells
pip install aspose-words

Konversikan Word ke JSON dengan Python

Berikut ini adalah langkah-langkah untuk mengonversi Word ke JSON dengan Python.

  • Muat dokumen Word menggunakan kelas Document dari Aspose.Words.
  • Simpan dokumen Word sebagai HTML menggunakan metode Document.save().
  • Muat file HTML menggunakan kelas Workbook dari Aspose.Cells.
  • Konversikan dokumen ke format JSON menggunakan metode Workbook.save().

Contoh kode berikut menunjukkan cara mengonversi dokumen Word ke JSON dengan Python.

# Muat dokumen
doc = aw.Document("document1.docx")

# Simpan dokumen dalam format HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Muat file HTML dalam instance kelas Workbook
book = Workbook("html_output.html")

# Simpan sebagai JSON
book.save("word-to-json.json", SaveFormat.JSON)

Konversikan Kata Terlindungi ke JSON dengan Python

Anda juga dapat memuat dokumen Word yang dilindungi menggunakan kata sandinya dan mengubahnya menjadi format JSON. Berikut ini adalah langkah-langkah untuk mengonversi dokumen Word yang dilindungi ke JSON dengan Python.

  • Muat dokumen Word menggunakan kelas Document dari Aspose.Words.
  • Gunakan kelas LoadOptions dari Aspose.Words untuk menentukan kata sandi dokumen Word yang dilindungi.
  • Simpan dokumen Word sebagai HTML menggunakan metode Document.save().
  • Muat file HTML menggunakan kelas Workbook dari Aspose.Cells.
  • Konversikan dokumen ke format JSON menggunakan metode Workbook.save().

Contoh kode berikut menunjukkan cara mengonversi dokumen Word yang dilindungi ke JSON dengan Python.

# Muat dokumen yang dilindungi menggunakan LoadOptions
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# Simpan dokumen dalam format HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Muat file HTML dalam instance kelas Workbook
book = Workbook("html_output.html")

# Simpan sebagai JSON
book.save("word-to-json.json", SaveFormat.JSON)

Pustaka Konverter Word ke JSON Python - Dapatkan Lisensi Gratis

Anda bisa mendapatkan lisensi sementara gratis untuk menggunakan perpustakaan tanpa batasan evaluasi.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengonversi Word ke JSON dengan Python. Selain itu, Anda telah melihat cara mengubah dokumen Word yang dilindungi kata sandi menjadi JSON secara terprogram. Selain itu, Anda dapat mengunjungi dokumentasi Aspose.Words for Python dan Aspose.Cells for Python untuk mempelajari lebih lanjut tentang pustaka. Jika Anda memiliki pertanyaan, jangan ragu untuk memberi tahu kami melalui forum kami.

Lihat juga