Format file Microsoft Word DOC/DOCX terkenal karena pengolah kata mendukung berbagai fitur untuk mengatur dan menjelaskan informasi. Demikian pula, format file HTML sangat membantu untuk menampilkan informasi dalam aplikasi web. Pada artikel ini, Anda akan mempelajari konversi file Word (DOC/DOCX) ke HTML atau HTML5 menggunakan Java. Berikut ini adalah kasus penggunaan yang akan Anda jelajahi di sini:

Konverter Java DOCX ke HTML atau HTML5 - Instalasi

Hal pertama yang pertama, Anda dapat dengan mudah mengonfigurasi Aspose.Words for Java API di aplikasi Anda. Anda dapat mengunduh file JAR dari Rilis bagian baru di mana semua API diperbarui hampir setiap bulan. Selain itu, semua API Java, yang ditawarkan oleh Aspose, dihosting melalui repositori Maven. Demikian pula, ketergantungan Aspose.Words for Java dapat ditentukan dalam proyek Maven Anda dengan konfigurasi berikut:

Gudang:

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://repository.aspose.com/repo/</url>
    </repository>
</repositories>

Ketergantungan:

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>20.6</version>
        <classifier>jdk17</classifier>
    </dependency>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>20.6</version>
        <classifier>javadoc</classifier>
    </dependency>
</dependencies>

Sekarang kita siap untuk konversi DOCX ke HTML dalam aplikasi Java.

Konversi Word (DOC/DOCX) ke HTML menggunakan Java

Anda dapat mengonversi Word ke HTML dengan mengikuti langkah-langkah di bawah ini:

  1. Muat file Word sumber dengan ekstensi DOC atau DOCX
  2. Simpan file sebagai output HTML

Contoh kode di bawah ini menunjukkan cara mengonversi DOCX ke HTML menggunakan Java:

// Muat dokumen dari disk.
Document doc = new Document(dataDir + "TestFile.docx");
// Simpan dokumen ke dalam HTML.
doc.save(dataDir + "Document_out.html", SaveFormat.HTML);

Masukkan Pratinjau file DOCX

Word ke HTML di Jawa

Keluaran Pratinjau file HTML

DOCX ke HTML di Jawa

Jadi, Anda dapat melihat fidelitas tinggi dari rendering dokumen dengan tangkapan layar ini. API mampu mengonversi teks, gambar, tabel, dan banyak lagi.

Konversikan DOCX ke HTML5 menggunakan Java

HTML5 adalah versi terbaru dari HTML. Kami telah mencatat permintaan berulang untuk mendukung HTML5 di Aspose.Words API. Oleh karena itu, konversi DOCX ke HTML5 didukung dan Anda dapat mengonversi file dengan langkah-langkah berikut:

  1. Pertama, muat masukan file DOCX
  2. Setel HtmlSaveOptions sambil menyetel SaveFormat
  3. Tetapkan nilai enumerasi dari HtmlVersion.HTML5
  4. Simpan file keluaran

Cuplikan kode di bawah ini menunjukkan cara mengonversi DOCX ke HTML5 di Java:

// Muat dokumen dari disk.
Document doc = new Document(dataDir + "TestFile.docx");
HtmlSaveOptions opts = new HtmlSaveOptions(SaveFormat.HTML);
opts.setHtmlVersion(HtmlVersion.HTML_5);
opts.setExportImagesAsBase64(true);
opts.setExportPageMargins(true);        
doc.save(dataDir + "TestFile.html", opts);

Konversikan file Word yang Dilindungi Kata Sandi ke HTML menggunakan Java

File DOC atau DOCX terkadang dilindungi kata sandi atau dienkripsi menggunakan kata sandi. Anda juga dapat mengonversi file tersebut ke HTML. Namun, Anda memerlukan kata sandi saat memuat file kata. Anda dapat mengikuti langkah-langkah di bawah ini untuk konversi DOCX ke HTML:

  1. Pertama, inisialisasi objek kelas LoadOptions
  2. Tetapkan kata sandi
  3. Muat file DOCX terenkripsi
  4. Konversikan DOCX ke HTML

Demikian pula, contoh kode berikut menunjukkan cara mengonversi file DOCX yang dilindungi kata sandi ke HTML menggunakan Java:

LoadOptions options = new LoadOptions();
options.setPassword("aspose");
// Muat dokumen dari disk.
Document doc = new Document(dataDir + "TestFile.docx" , options); 
//Simpan dokumen dalam format HTML.
doc.save(dataDir + "DocxToHTML.html",SaveFormat.HTML);

Konversi Word ke MHTML menggunakan Java

File MHTML adalah file tunggal yang berisi konten dan media yang disematkan. Anda dapat mengonversi file kata (DOC/DOCX) ke MHTML dengan langkah-langkah berikut:

  1. Muat file DOCX masukan
  2. Simpan file MHTML keluaran menggunakan SaveFormat.MHTML

Cuplikan kode di bawah ini didasarkan pada langkah-langkah ini. Oleh karena itu, ini menunjukkan cara mengonversi DOCX ke MHML dengan Java:

// Muat dokumen kata dari disk.
Document doc = new Document(dataDir + "TestFile.docx");
// Simpan dokumen ke dalam MHTML.
doc.save(dataDir + "Document.mhtml", SaveFormat.MHTML);

Kesimpulan

Sebagai penutup, kami telah mempelajari konversi dokumen kata tanpa perlu Microsoft Word. Misalnya, DOCX ke HTML, MHTML, atau HTML5 sesuai kebutuhan Anda. Demikian juga, kami telah mengamati dengan tangkapan layar bahwa konversi dilakukan dengan fidelitas tinggi dan kompatibilitas antara format file. Jadi Anda dapat mencoba API di lingkungan Java Anda sendiri. Namun, jika Anda menghadapi masalah saat menyiapkan atau menguji API, Anda dapat menghubungi kami melalui Forum Dukungan Gratis!

Lihat juga