Python で Word を JSON に変換する

さまざまなケースで、Python アプリケーション内からプログラムで Word から JSON への変換を実行する必要があります。たとえば、Word 文書からデータをエクスポートし、JSON 形式で処理または転送します。この記事では、Word 文書のテキストを簡単に JSON 形式に変換する方法を学びます。さらに、保護された Word ドキュメントを読み込んで、プログラムで JSON に変換する方法を学習します。それでは、Python で Word を JSON に変換してみましょう。

Python で Word を JSON に変換する方法

Word ドキュメントを JSON 形式に変換するには、次の手順を実行します。

  • Word 文書を読み込みます。
  • HTML形式に変換します。
  • HTML ファイルを JSON 形式で保存します。

これらの手順を Python でプログラムによって実装する方法を見てみましょう。このために、次のセクションで説明するように、最初にいくつかのライブラリをインストールします。

Word を JSON に変換する Python ライブラリ - 無料ダウンロード

Aspose.Words for Python は、MS Word ドキュメントを作成および処理するために設計された強力なライブラリです。このライブラリを使用して、Word 文書のコンテンツを HTML にエクスポートします。 HTML コンテンツを取得したら、Aspose.Cells for Python を使用して JSON ファイルとして保存します。

次の pip コマンドを使用して、両方のライブラリをインストールできます。

pip install aspose-cells
pip install aspose-words

Python で Word を JSON に変換する

Python で Word を JSON に変換する手順は次のとおりです。

  • Aspose.Words の Document クラスを使用して Word ドキュメントをロードします。
  • Document.save() メソッドを使用して、Word 文書を HTML として保存します。
  • Aspose.Cells の Workbook クラスを使用して HTML ファイルを読み込みます。
  • Workbook.save() メソッドを使用してドキュメントを JSON 形式に変換します。

次のコード サンプルは、Python で Word ドキュメントを JSON に変換する方法を示しています。

# ドキュメントをロード
doc = aw.Document("document1.docx")

# ドキュメントを HTML 形式で保存する
doc.save("html_output.html", aw.SaveFormat.HTML)

# Workbook クラスのインスタンスに HTML ファイルをロードする
book = Workbook("html_output.html")

# JSON として保存
book.save("word-to-json.json", SaveFormat.JSON)

Python で保護された Word を JSON に変換する

パスワードを使用して保護された Word ドキュメントを読み込み、JSON 形式に変換することもできます。以下は、保護された Word ドキュメントを Python で JSON に変換する手順です。

  • Aspose.Words の Document クラスを使用して Word ドキュメントをロードします。
  • Aspose.Words の LoadOptions クラスを使用して、保護された Word ドキュメントのパスワードを指定します。
  • Document.save() メソッドを使用して、Word 文書を HTML として保存します。
  • Aspose.Cells の Workbook クラスを使用して HTML ファイルを読み込みます。
  • Workbook.save() メソッドを使用してドキュメントを JSON 形式に変換します。

次のコード サンプルは、保護された Word ドキュメントを Python で JSON に変換する方法を示しています。

# LoadOptions を使用して保護されたドキュメントを読み込む
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# ドキュメントを HTML 形式で保存する
doc.save("html_output.html", aw.SaveFormat.HTML)

# Workbook クラスのインスタンスに HTML ファイルをロードする
book = Workbook("html_output.html")

# JSON として保存
book.save("word-to-json.json", SaveFormat.JSON)

Python Word から JSON へのコンバーター ライブラリ - 無料ライセンスを取得

無料の一時ライセンス を取得して、評価制限なしでライブラリを使用できます。

結論

この記事では、Python で Word を JSON に変換する方法を学びました。さらに、パスワードで保護された Word ドキュメントをプログラムで JSON に変換する方法を見てきました。また、Aspose.Words for Python および Aspose.Cells for Python のドキュメントにアクセスして、ライブラリの詳細を調べることができます。ご不明な点がございましたら、フォーラム からお気軽にお問い合わせください。

関連項目