JavaでDOCXをJSONに変換する

特定のケースでは、Word DOCXの内容をプログラムでJSONファイルにエクスポートする必要があります。これを実現するために、この記事では、Javaアプリケーション内からDOCX文書のテキストをJSON形式に変換する方法についての簡単なガイドを提供します。また、保護されたDOCX文書をプログラムでJSONに変換する方法も学びます。それでは、JavaでDOCXをJSONに変換する方法に進みましょう。

JavaでDOCXをJSONに変換する方法

DOCX文書をJSON形式に変換するには、次の手順を実行する必要があります。

  • DOCX文書をロードします。
  • HTML形式に変換します。
  • JSON形式でHTMLファイルを保存します。

これらの手順をJavaでプログラム的に実行する方法を見てみましょう。このためには、次のセクションに記載されている2つのライブラリをインストールする必要があります。

DOCXをJSONに変換するためのJavaライブラリ - 無料ダウンロード

Aspose.Words for Javaは、MS Word文書を作成および処理するための強力なライブラリです。このライブラリを使用して、DOCXファイルの内容をHTMLにエクスポートします。次に、Aspose.Cells for Javaを使用して、HTMLコンテンツをJSONファイルとして保存します。両方のライブラリのJARをダウンロードするか、Maven構成を使用してインストールできます。

JARのダウンロード

Maven経由でインストール

<dependencies>
	<dependency>
		<groupId>com.aspose</groupId>
		<artifactId>aspose-words</artifactId>
		<version>22.7</version>
		<classifier>jdk17</classifier>
	</dependency>
	<dependency>
		<groupId>com.aspose</groupId>
		<artifactId>aspose-cells</artifactId>
		<version>22.7</version>
	</dependency>
</dependencies>
<repositories>
	<repository>
		<id>AsposeJavaAPI</id>
		<name>Aspose Java API</name>
		<url>https://repository.aspose.com/repo/</url>
	</repository>
</repositories>

JavaでDOCXをJSONに変換する

以下は、JavaでDOCXをJSONに変換する手順です。

以下のコードサンプルは、JavaでDOCX文書をJSONに変換する方法を示しています。

// Load Word document using Aspose.Words
Document doc = new Document("sample1.docx");
// Save as HTML
doc.save("html_output.html", SaveFormat.HTML);
// Load the saved HTML file using Aspose.Cells
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");
// Save HTML as JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);

Javaで保護されたDOCXをJSONに変換する

保護されたDOCX文書をパスワードを使用してロードし、JSON形式に変換することもできます。以下は、Javaで保護されたDOCX文書をJSONに変換する手順です。

以下のコードサンプルは、Javaで保護されたDOCX文書をJSONに変換する方法を示しています。

// Load Word document using Aspose.Words
Document doc = new Document("sample1.docx", new com.aspose.words.LoadOptions("MyPassword"));
// Save as HTML
doc.save("html_output.html", SaveFormat.HTML);
// Load the saved HTML file using Aspose.Cells
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");
// Save HTML as JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);

Java DOCXをJSONに変換するライブラリ - 無料ライセンスを取得する

ライブラリを評価制限なしで使用するための無料の一時ライセンスを取得できます。

結論

この記事では、JavaでDOCXをJSONに変換する方法を学びました。さらに、パスワード保護されたDOCX文書をプログラムでJSONに変換する方法も見ました。また、Aspose.Words for JavaおよびAspose.Cells for Javaのドキュメントを訪れて、他の機能を探索することができます。質問がある場合は、フォーラムを通じてお気軽にお問い合わせください。

参照