在某些情况下,您需要以编程方式将 Word DOC 的内容导出到 JSON 文件。为此,本文提供了一个简单指南,说明如何在 Java 应用程序中将 DOC 文档中的文本转换为 JSON 格式。您还将学习如何以编程方式将受保护的 DOC 文档转换为 JSON。因此,让我们继续在 Java 中将 DOC 转换为 JSON。
- 在 Java 中将 DOC 转换为 JSON 的步骤
- 将 DOC 转换为 JSON 的 Java 库 - 免费下载
- 在 Java 中将 DOC 转换为 JSON
- 在 Java 中将受保护的 DOC 转换为 JSON
如何在 Java 中将 DOC 转换为 JSON
要将 DOC 文档转换为 JSON 格式,我们需要执行以下步骤:
- 加载 DOC 文档。
- 将其转换为 HTML 格式。
- 以 JSON 格式保存 HTML 文件。
让我们看看如何在 Java 中以编程方式执行这些步骤。为此,您需要安装下一节中提到的两个库。
将 DOC 转换为 JSON 的 Java 库 - 免费下载
Aspose.Words for Java 是一个功能强大的库,可让您创建和处理 MS Word 文档。我们将使用该库将 DOC 文件的内容导出为 HTML。然后,我们将使用 Aspose.Cells for Java 将 HTML 内容保存为 JSON 文件。您可以下载这两个库的 JAR 或使用 Maven 配置安装它们。
下载 JAR
通过 Maven 安装
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>22.7</version>
<classifier>jdk17</classifier>
</dependency>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-cells</artifactId>
<version>22.7</version>
</dependency>
</dependencies>
<repositories>
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
</repositories>
在 Java 中将 DOC 转换为 JSON
以下是在 Java 中将 DOC 转换为 JSON 的步骤。
- 使用 com.aspose.words.Document 类加载 DOC 文档。
- 使用 Document.Save() 方法将 DOC 文档保存为 HTML。
- 使用 com.aspose.cells.Workbook 类加载 HTML 文件。
- 使用 Workbook.Save() 方法将文档转换为 JSON 格式。
以下代码示例展示了如何将 DOC 文档转换为 Java 中的 JSON。
// 使用 Aspose.Words 加载 DOC 文件
Document doc = new Document("sample1.doc");
// 另存为 HTML
doc.save("html_output.html", SaveFormat.HTML);
// 使用 Aspose.Cells 加载保存的 HTML 文件
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");
// 将 HTML 保存为 JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);
Java 将受保护的 DOC 转换为 JSON
您还可以使用密码加载受保护的 DOC 文档并将其转换为 JSON 格式。以下是将受保护的 DOC 文档转换为 Java 中的 JSON 的步骤。
- 使用 com.aspose.words.Document 类加载 DOC 文档。
- 使用 com.aspose.words.LoadOptions 类指定 DOC 文档的密码。
- 使用 Document.Save() 方法将 DOC 文档保存为 HTML。
- 使用 com.aspose.cells.Workbook 类加载 HTML 文件。
- 使用 Workbook.Save() 方法将文档转换为 JSON 格式。
以下代码示例展示了如何将受保护的 DOC 文档转换为 Java 中的 JSON。
// 使用 Aspose.Words 加载 DOC 文档
Document doc = new Document("sample1.doc", new com.aspose.words.LoadOptions("MyPassword"));
// 另存为 HTML
doc.save("html_output.html", SaveFormat.HTML);
// 使用 Aspose.Cells 加载保存的 HTML 文件
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");
// 将 HTML 保存为 JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);
Java DOC 到 JSON 转换器库 - 获得免费许可证
您可以获得 免费的临时许可证 来使用这些库而没有评估限制。
结论
在本文中,您学习了如何在 Java 中将 DOC 转换为 JSON。此外,您还了解了如何以编程方式将受密码保护的 DOC 文档转换为 JSON。此外,您可以访问 Aspose.Words for Java 和 Aspose.Cells for Java 的文档以探索其他功能。如果您有任何问题,请随时通过我们的 论坛 告诉我们。