在 Java 中將 Word 轉換為 TXT | DOCX 到 TXT | Java 單字到文本

在某些情況下,我們可能需要將資料從一種格式匯出為另一種格式。常見要求是將 Word 文件(DOCDOCX)轉換為純文字(TXT)檔案。在本文中,我們將學習如何使用 Java Word to Text Converter 函式庫將 Word 轉換為 TXT。

本文涵蓋以下主題:

Java Word 到文字轉換器庫

Aspose.Words for Java 是一個功能強大的函式庫,適合需要在 Java 程式中處理文件的開發人員。它允許開發人員在 Java 應用程式中以程式設計方式建立、編輯和轉換文件。您可以將其視為無需 Microsoft Word 即可處理文件的工具集。我們將使用該程式庫將 Word 文件轉換為純文字檔案。透過利用Aspose.Words for Java程式庫,我們可以輕鬆地將DOC或DOCX檔案轉換為TXT格式,從而使我們能夠從Word文件中提取文字並將其另存為簡單的文字檔案。

下載 API 的 JAR 或在基於 Maven 的 Java 應用程式中新增以下 pom.xml 配置。

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://releases.aspose.com/java/repo/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>24.3</version>
        <classifier>jdk17</classifier>
    </dependency>
<dependencies>

將 Word DOC 轉換為 TXT 的步驟

我們可以按照以下簡單步驟從Word文件中匯出文字並將其儲存為TXT格式:

  • 載入 Word DOC/DOCX 檔案。
  • 將其轉換為 TXT 格式。
  • 將文件儲存到所需位置。

我們不需要手動逐行或逐頁處理整個Word文件;我們可以利用Java庫來有效地提取文字內容。讓我們探討一下如何在 Java 中實現這一點。

在 Java 中將 Word DOC 轉換為 TXT

我們可以透過以下步驟輕鬆地將Word(DOC或DOCX)文件轉換為Java中的TXT檔案:

  • 首先,使用 Document 類別載入 Word DOC/DOCX。
  • 然後,使用 Document.save(filePath) 方法將文件儲存為 TXT 檔案。

以下程式碼範例展示如何使用 Java 將 Word 文件轉換為 TXT 格式。

// 此程式碼範例示範如何將 DOCX 檔案另存為 TXT
// 載入Word文件
Document doc = new Document("D:\\Files\\document.docx");

// 將文件另存為 TXT 文件
doc.save("D:\\Files\\doc-to-text.txt");
在 Java 中將 Word DOC 轉換為 TXT

在 Java 中將 Word DOC 轉換為 TXT

取得免費許可證

您可以獲得免費臨時許可證,將 Word 文件轉換為 TXT 格式,沒有評估限制。

在線將Word轉換為TXT

您也可以使用這個免費的Word to Text converter在線將DOCX轉換為TXT。快速、高品質、準確地將文字內容從 Word 文件匯出為純文字格式。

DOCX 到 TXT – 免費資源

除了將 DOC 或 DOCX 檔案轉換為 TXT 格式之外,還可以釋放 Aspose.Words for Java 的全部潛力。使用以下資源探索進階功能,例如建立、編輯、管理或轉換文件等:

結論

在這篇文章中,我們學習如何透過從 Word 文件中提取文字內容並將其儲存為純文字檔案來將 Word 轉換為文字。在 Java 中將 Word 轉換為 TXT 是一項簡單的任務,可以使用 Aspose.Words for Java 函式庫來完成。因此,下次當您發現自己需要將 Word 文件轉換為純文字時,可以使用上面提供的程式碼範例作為入門應用程式。如有任何疑問,請隨時透過我們的免費支援論壇與我們聯繫。

也可以看看