將 Word DOC DOCX 轉換為 HTML MHTML

本文介紹如何使用 C# 或 VB.NET 將 Word 文檔 DOC DOCX 轉換為 HTMLMHTMLAspose.Words for .NET API 可用於非常輕鬆地執行此轉換。 Microsoft Word 文檔的轉換是一個流行的用例,因此 API 支持不同的選項。您可以查看本文涵蓋的標題:

C# Word 到 HTML 或 MHTML 轉換器 API

Aspose.Words for .NET API 專門設計用於 Microsoft Word 支持的文件格式。您可以通過從 New Releases 部分下載 API,或使用以下命令從 NuGet 安裝它,將 DOCX 或 DOC 文件轉換為 HTML 或 MHTML 文件格式:

Install-Package Aspose.Words -Version 20.9.0

在 C# 中將 Word DOC 或 DOCX 轉換為 HTML

您可以使用 C# 或 VB.NET 在 .NET 應用程序中以編程方式將 word 文檔 (DOC/DOCX) 高效地轉換為 HTML 網頁。您需要按照以下步驟進行轉換:

  1. 載入輸入DOCX word文檔
  2. 初始化 HtmlSaveOptions 的實例
  3. 保存輸出的 HTML 文件

以下代碼片段遵循這些步驟並顯示如何使用 C# 或 VB.NET 將 DOC/DOCX 轉換為 HTML:

// 從磁盤加載文檔。
Document doc = new Document(dataDir + "Test File.docx");

// 設置 HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;

// 將文檔保存為 HTML
doc.Save(dataDir + "Document.html", options);

使用 C# 中的往返信息將 Word DOC 或 DOCX 轉換為 HTML

在 Word 到 HTML 的轉換過程中會保存一些附加信息。它被稱為往返信息,對於轉換後的 HTML 文件再次呈現為 word 文檔的場景很有用。您可以按照以下步驟使用 C# 將 DOC/DOCX 轉換為 HTML:

  1. 載入輸入的word文檔
  2. ExportRoundtripInformation 設置為 true
  3. 保存輸出的 HTML 文件

下面的代碼片段解釋瞭如何使用 C# 或 VB.NET 將 Word DOC/DOCX 文件轉換為帶有往返信息的 HTML:

// 從磁盤加載文檔。
Document doc = new Document(dataDir + "Test File (doc).docx");

HtmlSaveOptions options = new HtmlSaveOptions();

// HtmlSaveOptions.ExportRoundtripInformation 屬性指定
// 保存為 HTML、MHTML 或 EPUB 時是否寫入往返信息。
// 對於 HTML,默認值為 true,對於 MHTML 和 EPUB,默認值為 false。
options.ExportRoundtripInformation = true;
            
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);

在 C# 中將 Word DOC 或 DOCX 轉換為 MHTML

當您需要帶有嵌入圖像和字體的單個 HTML 文件時,MHTML 文件格式值得一提。您可以按照以下步驟將 Word 文檔 (DOC/DOCX) 轉換為 MHTML:

  1. 加載源 DOC/DOCX 文件
  2. SaveFormat 設置為 MHTML

下面的代碼片段顯示瞭如何使用 C# 或 VB.NET 將 word 文檔 (DOC/DOCX) 轉換為 MHML:

// 從磁盤加載文檔。
Document doc = new Document(dataDir + "Test File.docx");

// 設置 HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;

// 將文檔保存為 MHTML
doc.Save(dataDir + "Document.mhtml", options);

結論

在本文中,我們介紹瞭如何在 C# 中將 word 文檔轉換為 HTML 或 MHTML 文件,而無需安裝 Microsoft Word 應用程序。此外,您還通過示例和詳細步驟了解了調用 API 以將 Word 文檔導出為所需文件格式的方法。此外,您還可以查看 API 參考文檔。此外,您可以在 免費支持論壇 上給我們回信並詢問任何問題。

也可以看看