Format file Microsoft Word DOC/DOCX terkenal karena pengolah kata mendukung berbagai fitur untuk mengatur dan menjelaskan informasi. Demikian pula, format file HTML sangat membantu untuk menampilkan informasi dalam aplikasi web. Pada artikel ini, Anda akan mempelajari konversi file Word (DOC/DOCX) ke HTML atau HTML5 menggunakan Java. Berikut ini adalah kasus penggunaan yang akan Anda jelajahi di sini:
- Konversi Word (DOC/DOCX) ke HTML menggunakan Java
- Konversikan DOCX ke HTML5 menggunakan Java
- Konversikan file Word yang Dilindungi Kata Sandi ke HTML menggunakan Java
- Konversi Word ke MHTML menggunakan Java
Konverter Java DOCX ke HTML atau HTML5 - Instalasi
Hal pertama yang pertama, Anda dapat dengan mudah mengonfigurasi Aspose.Words for Java API di aplikasi Anda. Anda dapat mengunduh file JAR dari Rilis bagian baru di mana semua API diperbarui hampir setiap bulan. Selain itu, semua API Java, yang ditawarkan oleh Aspose, dihosting melalui repositori Maven. Demikian pula, ketergantungan Aspose.Words for Java dapat ditentukan dalam proyek Maven Anda dengan konfigurasi berikut:
Gudang:
<repositories>
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
</repositories>
Ketergantungan:
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>20.6</version>
<classifier>jdk17</classifier>
</dependency>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>20.6</version>
<classifier>javadoc</classifier>
</dependency>
</dependencies>
Sekarang kita siap untuk konversi DOCX ke HTML dalam aplikasi Java.
Konversi Word (DOC/DOCX) ke HTML menggunakan Java
Anda dapat mengonversi Word ke HTML dengan mengikuti langkah-langkah di bawah ini:
- Muat file Word sumber dengan ekstensi DOC atau DOCX
- Simpan file sebagai output HTML
Contoh kode di bawah ini menunjukkan cara mengonversi DOCX ke HTML menggunakan Java:
// Muat dokumen dari disk.
Document doc = new Document(dataDir + "TestFile.docx");
// Simpan dokumen ke dalam HTML.
doc.save(dataDir + "Document_out.html", SaveFormat.HTML);
Masukkan Pratinjau file DOCX
Keluaran Pratinjau file HTML
Jadi, Anda dapat melihat fidelitas tinggi dari rendering dokumen dengan tangkapan layar ini. API mampu mengonversi teks, gambar, tabel, dan banyak lagi.
Konversikan DOCX ke HTML5 menggunakan Java
HTML5 adalah versi terbaru dari HTML. Kami telah mencatat permintaan berulang untuk mendukung HTML5 di Aspose.Words API. Oleh karena itu, konversi DOCX ke HTML5 didukung dan Anda dapat mengonversi file dengan langkah-langkah berikut:
- Pertama, muat masukan file DOCX
- Setel HtmlSaveOptions sambil menyetel SaveFormat
- Tetapkan nilai enumerasi dari HtmlVersion.HTML5
- Simpan file keluaran
Cuplikan kode di bawah ini menunjukkan cara mengonversi DOCX ke HTML5 di Java:
// Muat dokumen dari disk.
Document doc = new Document(dataDir + "TestFile.docx");
HtmlSaveOptions opts = new HtmlSaveOptions(SaveFormat.HTML);
opts.setHtmlVersion(HtmlVersion.HTML_5);
opts.setExportImagesAsBase64(true);
opts.setExportPageMargins(true);
doc.save(dataDir + "TestFile.html", opts);
Konversikan file Word yang Dilindungi Kata Sandi ke HTML menggunakan Java
File DOC atau DOCX terkadang dilindungi kata sandi atau dienkripsi menggunakan kata sandi. Anda juga dapat mengonversi file tersebut ke HTML. Namun, Anda memerlukan kata sandi saat memuat file kata. Anda dapat mengikuti langkah-langkah di bawah ini untuk konversi DOCX ke HTML:
- Pertama, inisialisasi objek kelas LoadOptions
- Tetapkan kata sandi
- Muat file DOCX terenkripsi
- Konversikan DOCX ke HTML
Demikian pula, contoh kode berikut menunjukkan cara mengonversi file DOCX yang dilindungi kata sandi ke HTML menggunakan Java:
LoadOptions options = new LoadOptions();
options.setPassword("aspose");
// Muat dokumen dari disk.
Document doc = new Document(dataDir + "TestFile.docx" , options);
//Simpan dokumen dalam format HTML.
doc.save(dataDir + "DocxToHTML.html",SaveFormat.HTML);
Konversi Word ke MHTML menggunakan Java
File MHTML adalah file tunggal yang berisi konten dan media yang disematkan. Anda dapat mengonversi file kata (DOC/DOCX) ke MHTML dengan langkah-langkah berikut:
- Muat file DOCX masukan
- Simpan file MHTML keluaran menggunakan SaveFormat.MHTML
Cuplikan kode di bawah ini didasarkan pada langkah-langkah ini. Oleh karena itu, ini menunjukkan cara mengonversi DOCX ke MHML dengan Java:
// Muat dokumen kata dari disk.
Document doc = new Document(dataDir + "TestFile.docx");
// Simpan dokumen ke dalam MHTML.
doc.save(dataDir + "Document.mhtml", SaveFormat.MHTML);
Kesimpulan
Sebagai penutup, kami telah mempelajari konversi dokumen kata tanpa perlu Microsoft Word. Misalnya, DOCX ke HTML, MHTML, atau HTML5 sesuai kebutuhan Anda. Demikian juga, kami telah mengamati dengan tangkapan layar bahwa konversi dilakukan dengan fidelitas tinggi dan kompatibilitas antara format file. Jadi Anda dapat mencoba API di lingkungan Java Anda sendiri. Namun, jika Anda menghadapi masalah saat menyiapkan atau menguji API, Anda dapat menghubungi kami melalui Forum Dukungan Gratis!