Word 到 HTML Java

为了将 Word 文档的内容嵌入到您的应用程序中,您可能需要执行转换。在这种情况下,最广泛选择的转换是 Word 到 HTML 或 Word 到图像。据此,本文介绍了如何使用 Java 将 Word DOCXDOC 文件转换为 HTML。此外,我们将讨论如何将资源文件保存在单独的文件夹中。

用于 Word 到 HTML 转换的 Java API

对于 DOCX/DOC 到 HTML 的转换,我们将使用 Aspose.Words for Java。它是一个强大的 API,用于在 Java 应用程序中实现文字处理功能。此外,API 提供了 Word 文档到 HTML 和 其他格式 的高保真转换。您可以 下载 API 或从 Maven 安装它。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.10</version>
    <type>pom</type>
</dependency>

在 Java 中将 Word 文档转换为 HTML

要将 Word 文档转换为 HTML,您只需加载文档并将其保存为 HTML 文件。以下是使用 Java 将 Word DOCX 文件转换为 HTML 的步骤。

以下代码示例展示了如何使用 Java 将 Word 文档转换为 HTML。

// 从磁盘加载文档
Document doc = new Document("document.docx");

// 将文档另存为 HTML
doc.save("Document_out.html", SaveFormat.HTML);

在 Word 到 HTML 转换中指定资源文件夹

您还可以配置 API 以将资源文件保存在单独的文件夹中。此外,您可以将字体和图像分别保存在不同的文件夹中。以下是指定资源文件夹的步骤。

以下代码示例将资源文件保存在 Word 到 HTML 转换中的单独文件夹中。

// 加载文档
Document doc = new Document("Document.docx");

// 指定资源文件夹
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");

// 将 Word 文档转换为 HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);

您可以阅读更多 在 Word 到 HTML 转换中使用资源文件夹。

获取免费 API 许可证

您可以通过获得免费的 临时许可证 来使用 Aspose.Words for Java,而不受评估限制。

结论

在本文中,您学习了如何使用 Java 以编程方式将 Word DOCX 或 DOC 文件转换为 HTML。除此之外,您还了解了如何在 Word 到 HTML 的转换中单独存储资源文件。此外,您可以使用 documentation 阅读有关 Aspose.Words for Java 的更多信息。此外,您可以在我们的 论坛 上与我们分享您的疑问。

也可以看看