在 Java 中将 HTML 文件转换为 Word DOCX DOC

在各种情况下,您可能需要将 HTML 内容转换为 Word 文档。例如,用于从所见即所得 HTML 编辑器生成文档或将网页转换为 DOCX 或 DOC 格式。为了以编程方式执行此转换,本文介绍了如何将 HTML 文件转换为 Word DOCXDOCDOCM 或其他 Java 格式。

将 HTML 转换为 Word 的 Java 库

要将 HTML 转换为 DOCX、DOC、DOT、DOCM 和其他 Word 格式,我们将使用 Aspose.Words for Java。它是一个功能强大的库,可以以编程方式创建和操作 Word 文档。此外,它提供了一个内置的文档转换器,可提供高保真度的文字处理文档的转换。您可以从 下载部分 下载 API 的 JAR,或者使用 pom.xml 中的以下 Maven 配置进行安装。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

在 Java 中将 HTML 转换为 DOCX/DOC/DOCM

使用 Aspose.Words for Java,可以通过几个步骤将 HTML 文件转换为 Word 格式,如下所述。

Document.save() 方法中的 SaveFormat 枚举指定要转换 HTML 文件的格式。以下代码示例展示了如何在 Java 中从 HTML 生成 Word 文档。

// 使用 Document 类加载 HTML 文件
Document document = new Document("template.html");

// 将 HTML 文件转换为 Word DOCX 格式
document.save("output.docx", SaveFormat.DOCX); 

使用 Java 中的 URL 将网页转换为 Word

您还可以直接从其 URL 将网页转换为 Word 文档。以下是在 Java 中使用 URL 将 HTML 转换为 DOCX 的步骤。

以下代码示例演示如何使用 URL 将网页转换为 Word 文档。

// 创建和初始化 URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// 获取网页作为输入流
InputStream is = oracleURL.openStream();

// 初始化 HTML 加载选项
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// 将流加载到 Document 对象中
Document doc = new Document(is, htmloptions);

// 另存为 DOCX
doc.save("output.docx", SaveFormat.DOCX);

使用 Java 将 HTML 字符串转换为 Word

Aspose.Words for Java 还允许您从 HTML 字符串动态生成 Word 文档。以下是执行此操作的步骤。

以下代码示例展示了如何使用 Java 将 HTML 字符串转换为 DOCX 文件。

// 创建一个新文档
Document doc = new Document();

// 创建文档构建器
DocumentBuilder builder = new DocumentBuilder(doc);

// 插入 HTML
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// 另存为 DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);

获取免费 API 许可证

您可以通过获得免费的 临时许可证 来使用 Aspose.Words for Java,而不受评估限制。

结论

在本文中,您学习了如何使用 Java 以编程方式将 HTML 文件转换为 Word DOCX、DOC、DOCM 或其他格式。此外,您还了解了如何将 HTML 字符串或网页从 URL 动态转换为 Word 文档。您可以简单地安装 Aspose.Words for Java 并使用提供的代码来构建您的 HTML 到 Word 转换器。此外,您可以访问 文档 以了解更多关于 Aspose.Words for Java 的信息。此外,您可以在我们的 论坛 上与我们分享您的疑问。

也可以看看

信息:如果您需要从 PowerPoint 演示文稿中获取 Word 文档,您可以使用 Aspose Presentation to Word Document 转换器。