Kata ke HTML Python

Konversi Word ke HTML diperlukan dalam berbagai kasus, seperti untuk menyematkan konten dokumen di halaman web. Pada artikel ini, Anda akan mempelajari cara mengonversi dokumen MS Word DOCX atau DOC ke HTML menggunakan Python. Selain itu, Anda akan mempelajari cara mengontrol konversi Word ke HTML secara dinamis menggunakan berbagai opsi.

API Pengonversi Kata ke HTML Python

Untuk mengonversi dokumen Word ke HTML, kami akan menggunakan Aspose.Words for Python. Ini adalah API yang kuat dan kaya fitur untuk membuat dan memanipulasi dokumen Word. Selain itu, ini menyediakan konversi dokumen Word dengan ketelitian tinggi ke format lain. Aspose.Words for Python tersedia di PyPI dan Anda dapat menginstalnya menggunakan perintah pip berikut.

pip install aspose-words 

Konversi Dokumen Word ke HTML dengan Python

Berikut ini adalah langkah-langkah untuk mengubah dokumen Word menjadi file HTML menggunakan Python.

  • Muat dokumen Word menggunakan kelas Document.
  • Buat objek kelas HtmlSaveOptions.
  • Aktifkan ekspor sumber daya font menggunakan properti HtmlSaveOptions.exportfontresources.
  • Konversikan dokumen Word ke HTML menggunakan metode Document.save().

Contoh kode berikut menunjukkan cara mengonversi file DOCX ke HTML dengan Python.

import aspose.words as aw

# Muat dokumen dari disk
doc = aw.Document("Document.docx")

# Aktifkan ekspor font
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
  
# Simpan dokumen sebagai HTML
doc.save("Document.html", options)

Kustomisasi Konversi Word ke HTML dengan Python

Aspose.Words for Python juga menyediakan opsi berbeda untuk menyesuaikan konversi Word ke HTML. Misalnya, Anda dapat mengonversi dokumen dengan informasi bolak-balik, menentukan folder untuk menyimpan file sumber daya, dan sebagainya.

Mengonversi Dokumen Word dengan Informasi Pulang Pergi

HTML tidak mendukung semua fitur yang disediakan oleh MS Word, oleh karena itu, untuk meniru dokumen Word dalam HTML kita perlu menyimpan informasi tambahan yang disebut sebagai informasi bolak-balik. Berikut ini adalah langkah-langkah untuk mengaktifkan ekspor informasi bolak-balik dalam konversi Word ke HTML.

  • Muat dokumen Word menggunakan kelas Document.
  • Buat objek kelas HtmlSaveOptions dan setel properti HtmlSaveOptions.exportroundtripinformation ke true.
  • Konversikan dokumen Word ke HTML menggunakan metode Document.save() dan berikan nama file HTML dan HtmlSaveOptions sebagai parameter.

Contoh kode berikut menunjukkan cara mengekspor informasi bolak-balik dalam konversi Word ke HTML.

import aspose.words as aw

# Muat dokumen dari disk
doc = aw.Document("Document.docx")

# Aktifkan informasi pulang-pergi
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True 

# Simpan dokumen sebagai HTML
doc.save("Document.html", saveOptions)

Kata ke HTML: Tentukan Folder untuk Sumber Daya

Anda juga dapat menentukan folder tempat Anda ingin menyimpan semua sumber daya seperti gambar, file CSS, dan font. Untuk ini, Anda dapat menggunakan properti HtmlSaveOptions.exportfontresources. Anda juga dapat menentukan folder terpisah untuk font dan gambar masing-masing menggunakan properti HtmlSaveOptions.fontsfolder dan HtmlSaveOptions.imagesfolder. Berikut ini adalah langkah-langkah untuk menggunakan folder terpisah untuk menghemat sumber daya dalam konversi Word ke HTML.

  • Muat dokumen Word menggunakan kelas Document.
  • Buat objek kelas HtmlSaveOptions dan setel properti HtmlSaveOptions.exportfontresources ke true.
  • Tentukan nama folder sumber daya menggunakan properti HtmlSaveOptions.resourcefolder.
  • Konversikan dokumen Word ke HTML menggunakan metode Document.save() dan berikan nama file HTML dan HtmlSaveOptions sebagai parameter.

Contoh kode berikut menunjukkan cara menentukan folder sumber daya dalam konversi Word ke HTML.

import aspose.words as aw

# Muat dokumen dari disk
doc = aw.Document("Document.docx")

# Tentukan folder sumber daya
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"

# Simpan dokumen sebagai HTML
doc.save("Document.html", saveOptions)

Dapatkan Lisensi API Gratis

Anda bisa mendapatkan lisensi sementara untuk menggunakan Aspose.Words for Python tanpa batasan evaluasi.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengonversi dokumen Word ke HTML menggunakan Python. Selain itu, Anda telah melihat cara menyesuaikan konversi Word ke HTML secara dinamis. Selain itu, Anda dapat menjelajahi fitur lain dari Aspose.Words for Python menggunakan dokumentasi. Selain itu, Anda dapat mengajukan pertanyaan melalui forum kami.

Lihat juga

Info: Anda mungkin tertarik dengan API Python lain (Aspose.Slides for Python via NET) yang memungkinkan Anda untuk mengonversi presentasi menjadi gambar dan mengimpor gambar ke dalam presentasi.