本文介紹如何使用 C# 或 VB.NET 將 Word 文檔 DOC DOCX 轉換為 HTML 或 MHTML。 Aspose.Words for .NET API 可用於非常輕鬆地執行此轉換。 Microsoft Word 文檔的轉換是一個流行的用例,因此 API 支持不同的選項。您可以查看本文涵蓋的標題:
- C# Word (DOC/DOCX) 到 HTML 或 MHTML 轉換器 API
- 在 C# 中將 Word DOC 或 DOCX 轉換為 HTML 網頁
- 在 C# 中使用往返信息將 Word 轉換為 HTML
- 在 C# 中將 Word DOC 或 DOCX 轉換為 MHTML
C# Word 到 HTML 或 MHTML 轉換器 API
Aspose.Words for .NET API 專門設計用於 Microsoft Word 支持的文件格式。您可以通過從 New Releases 部分下載 API,或使用以下命令從 NuGet 安裝它,將 DOCX 或 DOC 文件轉換為 HTML 或 MHTML 文件格式:
Install-Package Aspose.Words -Version 20.9.0
在 C# 中將 Word DOC 或 DOCX 轉換為 HTML
您可以使用 C# 或 VB.NET 在 .NET 應用程序中以編程方式將 word 文檔 (DOC/DOCX) 高效地轉換為 HTML 網頁。您需要按照以下步驟進行轉換:
- 載入輸入DOCX word文檔
- 初始化 HtmlSaveOptions 的實例
- 保存輸出的 HTML 文件
以下代碼片段遵循這些步驟並顯示如何使用 C# 或 VB.NET 將 DOC/DOCX 轉換為 HTML:
// 從磁盤加載文檔。
Document doc = new Document(dataDir + "Test File.docx");
// 設置 HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;
// 將文檔保存為 HTML
doc.Save(dataDir + "Document.html", options);
使用 C# 中的往返信息將 Word DOC 或 DOCX 轉換為 HTML
在 Word 到 HTML 的轉換過程中會保存一些附加信息。它被稱為往返信息,對於轉換後的 HTML 文件再次呈現為 word 文檔的場景很有用。您可以按照以下步驟使用 C# 將 DOC/DOCX 轉換為 HTML:
- 載入輸入的word文檔
- 將 ExportRoundtripInformation 設置為 true
- 保存輸出的 HTML 文件
下面的代碼片段解釋瞭如何使用 C# 或 VB.NET 將 Word DOC/DOCX 文件轉換為帶有往返信息的 HTML:
// 從磁盤加載文檔。
Document doc = new Document(dataDir + "Test File (doc).docx");
HtmlSaveOptions options = new HtmlSaveOptions();
// HtmlSaveOptions.ExportRoundtripInformation 屬性指定
// 保存為 HTML、MHTML 或 EPUB 時是否寫入往返信息。
// 對於 HTML,默認值為 true,對於 MHTML 和 EPUB,默認值為 false。
options.ExportRoundtripInformation = true;
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);
在 C# 中將 Word DOC 或 DOCX 轉換為 MHTML
當您需要帶有嵌入圖像和字體的單個 HTML 文件時,MHTML 文件格式值得一提。您可以按照以下步驟將 Word 文檔 (DOC/DOCX) 轉換為 MHTML:
- 加載源 DOC/DOCX 文件
- 將 SaveFormat 設置為 MHTML
下面的代碼片段顯示瞭如何使用 C# 或 VB.NET 將 word 文檔 (DOC/DOCX) 轉換為 MHML:
// 從磁盤加載文檔。
Document doc = new Document(dataDir + "Test File.docx");
// 設置 HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;
// 將文檔保存為 MHTML
doc.Save(dataDir + "Document.mhtml", options);
結論
在本文中,我們介紹瞭如何在 C# 中將 word 文檔轉換為 HTML 或 MHTML 文件,而無需安裝 Microsoft Word 應用程序。此外,您還通過示例和詳細步驟了解了調用 API 以將 Word 文檔導出為所需文件格式的方法。此外,您還可以查看 API 參考 和 文檔。此外,您可以在 免費支持論壇 上給我們回信並詢問任何問題。