Konversi Word DOC DOCX ke HTML MHTML

Artikel ini mencakup cara mengonversi dokumen Word DOC DOCX menjadi HTML atau MHTML menggunakan C# atau VB.NET. Aspose.Words for .NET API dapat digunakan untuk melakukan konversi ini dengan cukup mudah. Konversi dokumen Microsoft Word adalah kasus penggunaan yang populer sehingga opsi yang berbeda didukung oleh API. Anda dapat melihat judul yang tercakup dalam artikel ini:

C# Kata ke HTML atau MHTML Converter API

Aspose.Words for .NET API dirancang khusus untuk bekerja dengan format file yang didukung Microsoft Word. Anda dapat mengonversi file DOCX atau DOC ke format file HTML atau MHTML dengan mengunduh API dari bagian Rilis Baru, atau dengan menginstalnya dari NuGet menggunakan perintah di bawah ini:

Install-Package Aspose.Words -Version 20.9.0

Konversikan Word DOC atau DOCX ke HTML dalam C#

Anda dapat mengonversi dokumen kata (DOC/DOCX) secara efisien ke halaman web HTML secara terprogram dalam aplikasi .NET menggunakan C# atau VB.NET. Anda harus mengikuti langkah-langkah di bawah ini untuk konversi:

  1. Muat masukan dokumen kata DOCX
  2. Inisialisasi instance HtmlSaveOptions
  3. Simpan file HTML keluaran

Cuplikan kode berikut mengikuti langkah-langkah ini dan menunjukkan cara mengonversi DOC/DOCX ke HTML menggunakan C# atau VB.NET:

// Muat dokumen dari disk.
Document doc = new Document(dataDir + "Test File.docx");

// Tetapkan HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;

// Simpan dokumen ke dalam HTML
doc.Save(dataDir + "Document.html", options);

Konversikan Word DOC atau DOCX ke HTML dengan Informasi Pulang Pergi dalam C#

Beberapa informasi tambahan disimpan selama konversi Word ke HTML. Ini dikenal sebagai informasi bolak-balik dan berguna untuk skenario di mana file HTML yang dikonversi dirender lagi sebagai dokumen kata. Anda dapat mengikuti langkah-langkah berikut untuk mengonversi DOC/DOCX ke HTML menggunakan C#:

  1. Muat dokumen kata masukan
  2. Setel ExportRoundtripInformation ke true
  3. Simpan file HTML keluaran

Cuplikan kode di bawah ini menjelaskan cara mengonversi file Word DOC/DOCX ke HTML dengan informasi bolak-balik menggunakan C# atau VB.NET:

// Muat dokumen dari disk.
Document doc = new Document(dataDir + "Test File (doc).docx");

HtmlSaveOptions options = new HtmlSaveOptions();

// Properti HtmlSaveOptions.ExportRoundtripInformation menentukan
// Apakah akan menulis informasi bolak-balik saat menyimpan ke HTML, MHTML, atau EPUB.
// Nilai default benar untuk HTML dan salah untuk MHTML dan EPUB.
options.ExportRoundtripInformation = true;
            
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);

Konversikan Word DOC atau DOCX ke MHTML dalam C#

Format file MHTML layak disebutkan saat Anda membutuhkan satu file HTML dengan gambar dan font tersemat. Anda dapat mengonversi dokumen Word (DOC/DOCX) ke MHTML dengan langkah-langkah di bawah ini:

  1. Muat file DOC/DOCX sumber
  2. Atur SaveFormat ke MHTML

Cuplikan kode di bawah ini menunjukkan cara mengonversi dokumen kata (DOC/DOCX) ke MHML menggunakan C# atau VB.NET:

// Muat dokumen dari disk.
Document doc = new Document(dataDir + "Test File.docx");

// Tetapkan HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;

// Simpan dokumen ke dalam MHTML
doc.Save(dataDir + "Document.mhtml", options);

Kesimpulan

Pada artikel ini, kami telah membahas cara mengonversi dokumen word menjadi file HTML atau MHTML dalam C# tanpa perlu menginstal aplikasi Microsoft Word. Selanjutnya, Anda telah belajar dengan contoh dan langkah-langkah mendetail untuk membuat panggilan API untuk mengekspor dokumen Word ke format file yang Anda perlukan. Selain itu, Anda dapat melihat referensi API dan Dokumentasi. Selain itu, Anda dapat membalas email kami dan bertanya tentang apa saja di Forum Dukungan Gratis.

Lihat juga