
Dalam berbagai kasus, Anda mungkin perlu mengonversi konten HTML ke dokumen Word. Misalnya, untuk membuat dokumen dari editor HTML WYSIWYG atau mengonversi halaman web ke format DOCX atau DOC. Untuk melakukan konversi ini secara terprogram, artikel ini membahas cara mengonversi file HTML ke Word DOCX, DOC, DOCM, atau format lain di Java.
- Perpustakaan untuk Mengonversi HTML ke Word
- Konversi File HTML ke DOCX/DOC/DOCM dll.
- Konversikan Halaman Web ke Word menggunakan URL
- String HTML ke Konversi Word
Perpustakaan Java untuk Mengonversi HTML ke Word
Untuk mengonversi HTML ke DOCX, DOC, DOT, DOCM, dan format Word lainnya, kami akan menggunakan Aspose.Words for Java. Ini adalah perpustakaan yang kuat untuk membuat dan memanipulasi dokumen Word secara terprogram. Selain itu, ini menyediakan pengonversi dokumen bawaan yang menyediakan konversi fidelitas tinggi dari/ke dokumen pengolah kata. Anda dapat mengunduh JAR API dari bagian unduhan atau menginstalnya menggunakan konfigurasi Maven berikut di pom.xml.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Konversikan HTML ke DOCX/DOC/DOCM di Java
Menggunakan Aspose.Words for Java, konversi file HTML ke format Word dapat dilakukan dalam beberapa langkah, yang disebutkan di bawah ini.
- Muat file HTML menggunakan kelas Document.
- Simpan file HTML sebagai dokumen Word menggunakan metode Document.save(string, SaveFormat).
Enum SaveFormat dalam metode Document.save() menentukan format file HTML yang ingin Anda konversi. Contoh kode berikut menunjukkan cara membuat dokumen Word dari HTML di Java.
// Muat file HTML menggunakan kelas Document
Document document = new Document("template.html");
// Konversi file HTML ke format Word DOCX
document.save("output.docx", SaveFormat.DOCX);
Konversikan Halaman Web ke Word menggunakan URL di Java
Anda juga dapat mengonversi halaman web menjadi dokumen Word langsung dari URL-nya. Berikut ini adalah langkah-langkah untuk mengkonversi HTML ke DOCX menggunakan URL di Java.
- Buat instance kelas URL dan inisialisasi dengan URL yang diinginkan.
- Buka URL ke objek InputStream.
- Buat instance dari kelas HtmlLoadOptions.
- Buat instance dari kelas Document dan inisialisasi dengan objek InputStream dan HtmlLoadOptions.
- Simpan halaman web sebagai dokumen Word menggunakan metode Document.save(string, SaveFormat).
Contoh kode berikut menunjukkan cara mengonversi halaman web ke dokumen Word menggunakan URL.
// Buat dan inisialisasi URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");
// Dapatkan halaman web sebagai aliran masukan
InputStream is = oracleURL.openStream();
// Inisialisasi opsi pemuatan HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();
// Muat aliran ke objek Document
Document doc = new Document(is, htmloptions);
// Simpan sebagai DOCX
doc.save("output.docx", SaveFormat.DOCX);
Konversi String HTML ke Word menggunakan Java
Aspose.Words for Java juga memungkinkan Anda membuat dokumen Word dari string HTML secara dinamis. Berikut ini adalah langkah-langkah untuk melakukan operasi ini.
- Buat instance dari kelas Document.
- Buat instance dari kelas DocumentBuilder dan inisialisasi dengan objek Document.
- Sisipkan HTML ke dalam dokumen menggunakan metode DocumentBuilder.InsertHtml(string).
- Simpan dokumen Word menggunakan metode Document.save(string, SaveFormat).
Contoh kode berikut menunjukkan cara mengonversi string HTML ke file DOCX menggunakan Java.
// Buat dokumen baru
Document doc = new Document();
// Buat pembuat dokumen
DocumentBuilder builder = new DocumentBuilder(doc);
// Sisipkan HTML
builder.insertHtml("<ul>\r\n" +
"<li>Item1</li>\r\n" +
"<li>Item2</li>\r\n" +
"</ul>");
// Simpan sebagai DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);
Dapatkan Lisensi API Gratis
Anda dapat menggunakan Aspose.Words for Java tanpa batasan evaluasi dengan mendapatkan [lisensi sementara] gratis19.
Kesimpulan
Pada artikel ini, Anda telah mempelajari cara mengonversi file HTML ke Word DOCX, DOC, DOCM, atau format lain secara terprogram menggunakan Java. Selain itu, Anda telah melihat cara mengonversi string HTML atau halaman web dari URL ke dokumen Word secara dinamis. Anda cukup menginstal Aspose.Words for Java dan menggunakan kode yang disediakan untuk membangun konverter HTML ke Word Anda. Selain itu, Anda dapat mengunjungi dokumentasi untuk mempelajari lebih lanjut tentang Aspose.Words for Java. Selain itu, Anda dapat membagikan pertanyaan Anda kepada kami di forum kami.
Lihat juga
- Buat Dokumen Word tanpa MS Office menggunakan Java
- Konversi PDF ke Word di Jawa
- Konversi Word ke PDF di Java
Info: Jika Anda perlu mendapatkan dokumen Word dari presentasi PowerPoint, Anda dapat menggunakan pengonversi Aspose Presentation to Word Document.