在 Python 中將 Word 轉換為 JSON

在各種情況下,您必須在 Python 應用程序中以編程方式執行 Word 到 JSON 的轉換。例如,將 Word 文檔中的數據導出並以 JSON 格式處理或傳輸。在本文中,您將學習如何輕鬆地將 Word 文檔中的文本轉換為 JSON 格式。此外,您將學習如何加載受保護的 Word 文檔並以編程方式將其轉換為 JSON。因此,讓我們繼續在 Python 中將 Word 轉換為 JSON。

如何在 Python 中將 Word 轉換為 JSON

要將 Word 文檔轉換為 JSON 格式,我們將執行以下步驟:

  • 加載 Word 文檔。
  • 將其轉換為 HTML 格式。
  • 以 JSON 格式保存 HTML 文件。

讓我們看看如何在 Python 中以編程方式實現這些步驟。為此,我們將首先安裝幾個庫,如下一節所示。

將 Word 轉換為 JSON 的 Python 庫 - 免費下載

Aspose.Words for Python 是一個功能強大的庫,旨在創建和處理 MS Word 文檔。我們將使用此庫將 Word 文檔的內容導出為 HTML。一旦我們有了 HTML 內容,我們將使用 Aspose.Cells for Python 將其保存為 JSON 文件。

您可以使用以下 pip 命令安裝這兩個庫。

pip install aspose-cells
pip install aspose-words

在 Python 中將 Word 轉換為 JSON

以下是在 Python 中將 Word 轉換為 JSON 的步驟。

  • 使用 Aspose.Words 的文檔類加載 Word 文檔。
  • 使用 Document.save() 方法將 Word 文檔保存為 HTML。
  • 使用 Aspose.Cells 的工作簿類加載 HTML 文件。
  • 使用 Workbook.save() 方法將文檔轉換為 JSON 格式。

以下代碼示例顯示瞭如何在 Python 中將 Word 文檔轉換為 JSON。

# 載入文件
doc = aw.Document("document1.docx")

# 以 HTML 格式保存文檔
doc.save("html_output.html", aw.SaveFormat.HTML)

# 在 Workbook 類的實例中加載 HTML 文件
book = Workbook("html_output.html")

# 另存為 JSON
book.save("word-to-json.json", SaveFormat.JSON)

在 Python 中將受保護的單詞轉換為 JSON

您還可以使用密碼加載受保護的 Word 文檔,並將它們轉換為 JSON 格式。以下是在 Python 中將受保護的 Word 文檔轉換為 JSON 的步驟。

  • 使用 Aspose.Words 的文檔類加載 Word 文檔。
  • 使用 Aspose.Words 的 LoadOptions 類來指定受保護的 Word 文檔的密碼。
  • 使用 Document.save() 方法將 Word 文檔保存為 HTML。
  • 使用 Aspose.Cells 的工作簿類加載 HTML 文件。
  • 使用 Workbook.save() 方法將文檔轉換為 JSON 格式。

以下代碼示例顯示瞭如何在 Python 中將受保護的 Word 文檔轉換為 JSON。

# 使用 LoadOptions 加載受保護的文檔
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# 以 HTML 格式保存文檔
doc.save("html_output.html", aw.SaveFormat.HTML)

# 在 Workbook 類的實例中加載 HTML 文件
book = Workbook("html_output.html")

# 另存為 JSON
book.save("word-to-json.json", SaveFormat.JSON)

Python Word 到 JSON 轉換器庫 - 獲取免費許可證

您可以獲得 免費的臨時許可證 以在沒有評估限制的情況下使用這些庫。

結論

在本文中,您學習瞭如何在 Python 中將 Word 轉換為 JSON。此外,您還了解瞭如何以編程方式將受密碼保護的 Word 文檔轉換為 JSON。此外,您可以訪問 Aspose.Words for PythonAspose.Cells for Python 的文檔來探索有關這些庫的更多信息。如果您有任何疑問,請隨時通過我們的 論壇 告訴我們。

也可以看看