在某些情況下,您需要以編程方式將 Word DOCX 的內容導出到 JSON 文件。為實現這一點,本文提供了一個簡單指南,介紹如何在 Java 應用程序中將 DOCX 文檔中的文本轉換為 JSON 格式。您還將學習如何以編程方式將受保護的 DOCX 文檔轉換為 JSON。因此,讓我們繼續在 Java 中將 DOCX 轉換為 JSON。
- 在 Java 中將 DOCX 轉換為 JSON 的步驟
- 將 DOCX 轉換為 JSON 的 Java 庫 - 免費下載
- 在 Java 中將 DOCX 轉換為 JSON
- 在 Java 中將受保護的 DOCX 轉換為 JSON
如何在 Java 中將 DOCX 轉換為 JSON
要將 DOCX 文檔轉換為 JSON 格式,我們需要執行以下步驟:
- 加載 DOCX 文檔。
- 將其轉換為 HTML 格式。
- 以 JSON 格式保存 HTML 文件。
讓我們看看如何在 Java 中以編程方式執行這些步驟。為此,您需要安裝下一節中提到的兩個庫。
將 DOCX 轉換為 JSON 的 Java 庫 - 免費下載
Aspose.Words for Java 是一個功能強大的庫,可讓您創建和處理 MS Word 文檔。我們將使用此庫將 DOCX 文件的內容導出為 HTML。然後,我們將使用 Aspose.Cells for Java 將 HTML 內容保存為 JSON 文件。您可以下載這兩個庫的 JAR 或使用 Maven 配置安裝它們。
下載 JAR
通過 Maven 安裝
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>22.7</version>
<classifier>jdk17</classifier>
</dependency>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-cells</artifactId>
<version>22.7</version>
</dependency>
</dependencies>
<repositories>
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
</repositories>
在 Java 中將 DOCX 轉換為 JSON
以下是在 Java 中將 DOCX 轉換為 JSON 的步驟。
- 使用 com.aspose.words.Document 類加載 DOCX 文檔。
- 使用 Document.Save() 方法將 DOCX 文檔保存為 HTML。
- 使用 com.aspose.cells.Workbook 類加載 HTML 文件。
- 使用 Workbook.Save() 方法將文檔轉換為 JSON 格式。
以下代碼示例顯示瞭如何在 Java 中將 DOCX 文檔轉換為 JSON。
// 使用 Aspose.Words 加載 Word 文檔
Document doc = new Document("sample1.docx");
// 另存為 HTML
doc.save("html_output.html", SaveFormat.HTML);
// 使用 Aspose.Cells 加載保存的 HTML 文件
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");
// 將 HTML 保存為 JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);
Java 將受保護的 DOCX 轉換為 JSON
您還可以使用密碼加載受保護的 DOCX 文檔並將它們轉換為 JSON 格式。以下是在 Java 中將受保護的 DOCX 文檔轉換為 JSON 的步驟。
- 使用 com.aspose.words.Document 類加載 DOCX 文檔。
- 使用 com.aspose.words.LoadOptions 類指定 DOCX 文檔的密碼。
- 使用 Document.Save() 方法將 DOCX 文檔保存為 HTML。
- 使用 com.aspose.cells.Workbook 類加載 HTML 文件。
- 使用 Workbook.Save() 方法將文檔轉換為 JSON 格式。
以下代碼示例顯示瞭如何在 Java 中將受保護的 DOCX 文檔轉換為 JSON。
// 使用 Aspose.Words 加載 Word 文檔
Document doc = new Document("sample1.docx", new com.aspose.words.LoadOptions("MyPassword"));
// 另存為 HTML
doc.save("html_output.html", SaveFormat.HTML);
// 使用 Aspose.Cells 加載保存的 HTML 文件
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");
// 將 HTML 保存為 JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);
Java DOCX 到 JSON 轉換器庫 - 獲取免費許可證
您可以獲得 免費的臨時許可證 以在沒有評估限制的情況下使用這些庫。
結論
在本文中,您了解瞭如何在 Java 中將 DOCX 轉換為 JSON。此外,您還了解瞭如何以編程方式將受密碼保護的 DOCX 文檔轉換為 JSON。此外,您可以訪問 Aspose.Words for Java 和 Aspose.Cells for Java 的文檔來探索其他功能。如果您有任何疑問,請隨時通過我們的 論壇 告訴我們。