本文介绍如何使用 C# 或 VB.NET 将 Word 文档 DOC DOCX 转换为 HTML 或 MHTML。 Aspose.Words for .NET API 可用于非常轻松地执行此转换。 Microsoft Word 文档的转换是一种流行的用例,因此 API 支持不同的选项。您可以查看本文中涵盖的标题:
- C# Word (DOC/DOCX) 到 HTML 或 MHTML 转换器 API
- 在 C# 中将 Word DOC 或 DOCX 转换为 HTML 网页
- C# 中包含往返信息的 Word 到 HTML
- 在 C# 中将 Word DOC 或 DOCX 转换为 MHTML
C# Word 到 HTML 或 MHTML 转换器 API
Aspose.Words for .NET API 专为使用 Microsoft Word 支持的文件格式而设计。您可以通过从 New Releases 部分下载 API 或使用以下命令从 NuGet 安装 API,将 DOCX 或 DOC 文件转换为 HTML 或 MHTML 文件格式:
Install-Package Aspose.Words -Version 20.9.0
在 C# 中将 Word DOC 或 DOCX 转换为 HTML
您可以使用 C# 或 VB.NET 在 .NET 应用程序中以编程方式有效地将 Word 文档 (DOC/DOCX) 转换为 HTML 网页。您需要按照以下步骤进行转换:
- 加载输入DOCX word文档
- 初始化 HtmlSaveOptions 的实例
- 保存输出 HTML 文件
以下代码片段遵循这些步骤,并展示了如何使用 C# 或 VB.NET 将 DOC/DOCX 转换为 HTML:
// 从磁盘加载文档。
Document doc = new Document(dataDir + "Test File.docx");
// 设置 HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;
// 将文档保存为 HTML
doc.Save(dataDir + "Document.html", options);
使用 C# 中的往返信息将 Word DOC 或 DOCX 转换为 HTML
在 Word 到 HTML 的转换过程中会保存一些附加信息。它被称为往返信息,对于转换后的 HTML 文件再次呈现为 Word 文档的场景很有用。您可以按照以下步骤使用 C# 将 DOC/DOCX 转换为 HTML:
- 加载输入的word文档
- 将 ExportRoundtripInformation 设置为 true
- 保存输出 HTML 文件
下面的代码片段解释了如何使用 C# 或 VB.NET 将 Word DOC/DOCX 文件转换为带有往返信息的 HTML:
// 从磁盘加载文档。
Document doc = new Document(dataDir + "Test File (doc).docx");
HtmlSaveOptions options = new HtmlSaveOptions();
// HtmlSaveOptions.ExportRoundtripInformation 属性指定
// 保存为 HTML、MHTML 或 EPUB 时是否写入往返信息。
// 对于 HTML,默认值为 true,对于 MHTML 和 EPUB,默认值为 false。
options.ExportRoundtripInformation = true;
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);
在 C# 中将 Word DOC 或 DOCX 转换为 MHTML
当您需要一个带有嵌入图像和字体的 HTML 文件时,值得一提的是 MHTML 文件格式。您可以通过以下步骤将 Word 文档 (DOC/DOCX) 转换为 MHTML:
- 加载源 DOC/DOCX 文件
- 将 SaveFormat 设置为 MHTML
下面的代码片段显示了如何使用 C# 或 VB.NET 将 word 文档 (DOC/DOCX) 转换为 MHML:
// 从磁盘加载文档。
Document doc = new Document(dataDir + "Test File.docx");
// 设置 HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;
// 将文档保存为 MHTML
doc.Save(dataDir + "Document.mhtml", options);
结论
在本文中,我们介绍了如何在 C# 中将 Word 文档转换为 HTML 或 MHTML 文件,而无需安装 Microsoft Word 应用程序。此外,您还通过示例和详细步骤了解了如何调用 API 以将 Word 文档导出为所需的文件格式。此外,您可以查看 API 参考 和 文档。此外,您可以在 免费支持论坛 上给我们回信并询问任何问题。