在 Python 中將 DOCX 轉換為 TXT

MS Word DOCDOCX 格式通常用於創建富文本文檔。您可以向 DOC/DOCX 文檔添加文本、表格、圖形、動畫和各種其他元素。然而,在某些情況下,例如要解析和分析 Word 文檔中的文本,您必須以編程方式將 DOC/DOCX 文件轉換為 TXT 格式。為此,本文介紹瞭如何在 Python 中將 DOC 或 DOCX 文件轉換為 TXT 格式。

Python DOC/DOCX 到 TXT 轉換器庫

要以 TXT 格式保存 DOC 和 DOCX 文件,我們將使用 Aspose.Words for Python。它是一個功能強大且高速的庫,提供了一系列功能來無縫創建和操作文本文檔。此外,它還提供高質量的文檔到其他格式的轉換。您可以使用以下 pip 命令從 PyPI 在您的 Python 應用程序中安裝該庫。

> pip install aspose-words

在 Python 中將 DOCX 轉換為 TXT

讓我們看看如何在 Python 中將 DOCX 文件轉換為 TXT。為此,您只需加載 DOCX 文件並將其另存為 TXT 文件即可。以下是在Python中將DOCX文件保存為TXT格式的步驟。

  • 使用 Document 類加載 DOCX 文件。
  • 使用 Document.save() 方法將 DOCX 保存為 TXT。

以下代碼示例顯示瞭如何在 Python 中執行 DOCX 到 TXT 的轉換。

import aspose.words as aw

# 加載 DOC/DOCX 文檔
doc = aw.Document("Input.docx")

# 另存為 TXT
doc.save("Output.txt")

獲得免費許可證

您可以獲得免費的臨時許可證 來使用 Aspose.Words for Python,而沒有評估限制。

結論

在本文中,您學習瞭如何在 Python 中將 DOC 或 DOCX 文件轉換為 TXT 格式。此功能允許您從 DOCX 文件中提取文本並將其保存為純 TXT 文件的形式。因此,您可以更方便地分析文本。此外,您可以使用 文檔 了解有關該庫的更多信息。此外,您可以通過我們的 論壇 分享您的問題或疑問。

也可以看看