Konversikan File HTML ke Word DOCX DOC di Java

Dalam berbagai kasus, Anda mungkin perlu mengonversi konten HTML ke dokumen Word. Misalnya, untuk membuat dokumen dari editor HTML WYSIWYG atau mengonversi halaman web ke format DOCX atau DOC. Untuk melakukan konversi ini secara terprogram, artikel ini membahas cara mengonversi file HTML ke Word DOCX, DOC, DOCM, atau format lain di Java.

Perpustakaan Java untuk Mengonversi HTML ke Word

Untuk mengonversi HTML ke DOCX, DOC, DOT, DOCM, dan format Word lainnya, kami akan menggunakan Aspose.Words for Java. Ini adalah perpustakaan yang kuat untuk membuat dan memanipulasi dokumen Word secara terprogram. Selain itu, ini menyediakan pengonversi dokumen bawaan yang menyediakan konversi fidelitas tinggi dari/ke dokumen pengolah kata. Anda dapat mengunduh JAR API dari bagian unduhan atau menginstalnya menggunakan konfigurasi Maven berikut di pom.xml.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Konversikan HTML ke DOCX/DOC/DOCM di Java

Menggunakan Aspose.Words for Java, konversi file HTML ke format Word dapat dilakukan dalam beberapa langkah, yang disebutkan di bawah ini.

Enum SaveFormat dalam metode Document.save() menentukan format file HTML yang ingin Anda konversi. Contoh kode berikut menunjukkan cara membuat dokumen Word dari HTML di Java.

// Muat file HTML menggunakan kelas Document
Document document = new Document("template.html");

// Konversi file HTML ke format Word DOCX
document.save("output.docx", SaveFormat.DOCX); 

Konversikan Halaman Web ke Word menggunakan URL di Java

Anda juga dapat mengonversi halaman web menjadi dokumen Word langsung dari URL-nya. Berikut ini adalah langkah-langkah untuk mengkonversi HTML ke DOCX menggunakan URL di Java.

Contoh kode berikut menunjukkan cara mengonversi halaman web ke dokumen Word menggunakan URL.

// Buat dan inisialisasi URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// Dapatkan halaman web sebagai aliran masukan
InputStream is = oracleURL.openStream();

// Inisialisasi opsi pemuatan HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// Muat aliran ke objek Document
Document doc = new Document(is, htmloptions);

// Simpan sebagai DOCX
doc.save("output.docx", SaveFormat.DOCX);

Konversi String HTML ke Word menggunakan Java

Aspose.Words for Java juga memungkinkan Anda membuat dokumen Word dari string HTML secara dinamis. Berikut ini adalah langkah-langkah untuk melakukan operasi ini.

Contoh kode berikut menunjukkan cara mengonversi string HTML ke file DOCX menggunakan Java.

// Buat dokumen baru
Document doc = new Document();

// Buat pembuat dokumen
DocumentBuilder builder = new DocumentBuilder(doc);

// Sisipkan HTML
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// Simpan sebagai DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);

Dapatkan Lisensi API Gratis

Anda dapat menggunakan Aspose.Words for Java tanpa batasan evaluasi dengan mendapatkan [lisensi sementara] gratis19.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengonversi file HTML ke Word DOCX, DOC, DOCM, atau format lain secara terprogram menggunakan Java. Selain itu, Anda telah melihat cara mengonversi string HTML atau halaman web dari URL ke dokumen Word secara dinamis. Anda cukup menginstal Aspose.Words for Java dan menggunakan kode yang disediakan untuk membangun konverter HTML ke Word Anda. Selain itu, Anda dapat mengunjungi dokumentasi untuk mempelajari lebih lanjut tentang Aspose.Words for Java. Selain itu, Anda dapat membagikan pertanyaan Anda kepada kami di forum kami.

Lihat juga

Info: Jika Anda perlu mendapatkan dokumen Word dari presentasi PowerPoint, Anda dapat menggunakan pengonversi Aspose Presentation to Word Document.