为了将 Word 文档的内容嵌入到您的应用程序中,您可能需要执行转换。在这种情况下,最广泛选择的转换是 Word 到 HTML 或 Word 到图像。据此,本文介绍了如何使用 Java 将 Word DOCX 或 DOC 文件转换为 HTML。此外,我们将讨论如何将资源文件保存在单独的文件夹中。
用于 Word 到 HTML 转换的 Java API
对于 DOCX/DOC 到 HTML 的转换,我们将使用 Aspose.Words for Java。它是一个强大的 API,用于在 Java 应用程序中实现文字处理功能。此外,API 提供了 Word 文档到 HTML 和 其他格式 的高保真转换。您可以 下载 API 或从 Maven 安装它。
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.10</version>
<type>pom</type>
</dependency>
在 Java 中将 Word 文档转换为 HTML
要将 Word 文档转换为 HTML,您只需加载文档并将其保存为 HTML 文件。以下是使用 Java 将 Word DOCX 文件转换为 HTML 的步骤。
- 使用 Document 类加载 Word 文档。
- 使用 Document.save(string, SaveFormat) 方法将 Word 文档转换为 HTML。
以下代码示例展示了如何使用 Java 将 Word 文档转换为 HTML。
// 从磁盘加载文档
Document doc = new Document("document.docx");
// 将文档另存为 HTML
doc.save("Document_out.html", SaveFormat.HTML);
在 Word 到 HTML 转换中指定资源文件夹
您还可以配置 API 以将资源文件保存在单独的文件夹中。此外,您可以将字体和图像分别保存在不同的文件夹中。以下是指定资源文件夹的步骤。
- 使用 Document 类加载 Word 文档。
- 创建 HtmlSaveOptions 类的对象。
- 使用 HtmlSaveOptions.setResourceFolder 方法设置资源文件夹。
- 使用 Document.save(string, HtmlSaveOptions) 方法将 Word 文档转换为 HTML。
以下代码示例将资源文件保存在 Word 到 HTML 转换中的单独文件夹中。
// 加载文档
Document doc = new Document("Document.docx");
// 指定资源文件夹
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");
// 将 Word 文档转换为 HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);
您可以阅读更多 在 Word 到 HTML 转换中使用资源文件夹。
获取免费 API 许可证
您可以通过获得免费的 临时许可证 来使用 Aspose.Words for Java,而不受评估限制。
结论
在本文中,您学习了如何使用 Java 以编程方式将 Word DOCX 或 DOC 文件转换为 HTML。除此之外,您还了解了如何在 Word 到 HTML 的转换中单独存储资源文件。此外,您可以使用 documentation 阅读有关 Aspose.Words for Java 的更多信息。此外,您可以在我们的 论坛 上与我们分享您的疑问。