将 Word DOC DOCX 转换为 HTML MHTML

本文介绍如何使用 C# 或 VB.NET 将 Word 文档 DOC DOCX 转换为 HTMLMHTMLAspose.Words for .NET API 可用于非常轻松地执行此转换。 Microsoft Word 文档的转换是一种流行的用例,因此 API 支持不同的选项。您可以查看本文中涵盖的标题:

C# Word 到 HTML 或 MHTML 转换器 API

Aspose.Words for .NET API 专为使用 Microsoft Word 支持的文件格式而设计。您可以通过从 New Releases 部分下载 API 或使用以下命令从 NuGet 安装 API,将 DOCX 或 DOC 文件转换为 HTML 或 MHTML 文件格式:

Install-Package Aspose.Words -Version 20.9.0

在 C# 中将 Word DOC 或 DOCX 转换为 HTML

您可以使用 C# 或 VB.NET 在 .NET 应用程序中以编程方式有效地将 Word 文档 (DOC/DOCX) 转换为 HTML 网页。您需要按照以下步骤进行转换:

  1. 加载输入DOCX word文档
  2. 初始化 HtmlSaveOptions 的实例
  3. 保存输出 HTML 文件

以下代码片段遵循这些步骤,并展示了如何使用 C# 或 VB.NET 将 DOC/DOCX 转换为 HTML:

// 从磁盘加载文档。
Document doc = new Document(dataDir + "Test File.docx");

// 设置 HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;

// 将文档保存为 HTML
doc.Save(dataDir + "Document.html", options);

使用 C# 中的往返信息将 Word DOC 或 DOCX 转换为 HTML

在 Word 到 HTML 的转换过程中会保存一些附加信息。它被称为往返信息,对于转换后的 HTML 文件再次呈现为 Word 文档的场景很有用。您可以按照以下步骤使用 C# 将 DOC/DOCX 转换为 HTML:

  1. 加载输入的word文档
  2. ExportRoundtripInformation 设置为 true
  3. 保存输出 HTML 文件

下面的代码片段解释了如何使用 C# 或 VB.NET 将 Word DOC/DOCX 文件转换为带有往返信息的 HTML:

// 从磁盘加载文档。
Document doc = new Document(dataDir + "Test File (doc).docx");

HtmlSaveOptions options = new HtmlSaveOptions();

// HtmlSaveOptions.ExportRoundtripInformation 属性指定
// 保存为 HTML、MHTML 或 EPUB 时是否写入往返信息。
// 对于 HTML,默认值为 true,对于 MHTML 和 EPUB,默认值为 false。
options.ExportRoundtripInformation = true;
            
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);

在 C# 中将 Word DOC 或 DOCX 转换为 MHTML

当您需要一个带有嵌入图像和字体的 HTML 文件时,值得一提的是 MHTML 文件格式。您可以通过以下步骤将 Word 文档 (DOC/DOCX) 转换为 MHTML:

  1. 加载源 DOC/DOCX 文件
  2. SaveFormat 设置为 MHTML

下面的代码片段显示了如何使用 C# 或 VB.NET 将 word 文档 (DOC/DOCX) 转换为 MHML:

// 从磁盘加载文档。
Document doc = new Document(dataDir + "Test File.docx");

// 设置 HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;

// 将文档保存为 MHTML
doc.Save(dataDir + "Document.mhtml", options);

结论

在本文中,我们介绍了如何在 C# 中将 Word 文档转换为 HTML 或 MHTML 文件,而无需安装 Microsoft Word 应用程序。此外,您还通过示例和详细步骤了解了如何调用 API 以将 Word 文档导出为所需的文件格式。此外,您可以查看 API 参考文档。此外,您可以在 免费支持论坛 上给我们回信并询问任何问题。

也可以看看