在文件處理領域,經常需要將 Word 文件轉換為更簡單的純文字格式。無論是出於資料擷取、內容分析或相容性原因,將 Word(.doc、.docx)檔案轉換為純文字(.txt)的能力對於開發人員來說都是一項寶貴的技能。在這篇文章中,我們將探討如何在 C# 應用程式中將 Word 文件轉換為 TXT 格式。
用於 Word 到 TXT 轉換的 C# 庫
Aspose.Words for .NET 是一個功能豐富的文件處理庫,使開發人員能夠處理各種格式的 Word 文件。它提供了一組用於文件創建、操作、轉換和呈現的 API。我們將使用該庫從 Word 文件中提取純文字內容。
要從 NuGet 安裝庫,可以使用以下命令。或者您可以從 Releases 部分下載。
PM> Install-Package Aspose.Words
將 Word DOC 轉換為 TXT 的步驟
您只需幾個步驟即可從 Word 文件中提取文字並將其儲存為 TXT 格式,Aspose.Words for .NET 讓這一切變得非常簡單。以下是我們將 Word 轉換為 TXT 所需執行的步驟。
- 載入 Word DOC/DOCX 檔案。
- 將其轉換為 TXT 格式並將檔案儲存到所需位置。
因此,您不必解析整個 Word 文件並逐行或逐頁提取文字。現在讓我們編寫 C# 程式碼來從 Word 文件中提取文字。
在 C# 中將 Word DOC 轉換為 TXT
以下是在 C# 中將 Word DOC 或 DOCX 文件另存為 TXT 檔案的步驟。
- 首先,使用 Document 類別載入 Word DOC/DOCX。
- 然後,使用 Document.Save(filePath) 方法將文件儲存為 TXT 檔案。
以下 C# 程式碼片段將 Word 文件轉換為 TXT 格式。
// 載入Word文件
Document doc = new Document("document.docx");
// 將文件另存為 TXT 文件
doc.Save("doc-to-text.txt");
使用免費的 C# Word 到 TXT 轉換器
您可以獲得免費臨時許可證,將 Word 文件轉換為 TXT 格式,沒有評估限制。
探索 C# 單字庫
您可以造訪 C# Word 庫的文件來探索其他功能。如果您有任何疑問,請隨時透過我們的論壇告訴我們。
結論
在這篇文章中,我們探討如何使用 Aspose.Words for .NET 將 Word 文件轉換為 C# 中的 TXT 檔案。無需解析整個 Word 文檔,只需幾個步驟即可從文檔中提取純文字。 Aspose.Words 簡化了以程式設計方式處理 Word 文件的過程,為文件轉換任務提供了可靠且高效的解決方案。將此庫整合到您的 C# 專案中使您能夠輕鬆處理文檔,為您的應用程式開啟一個充滿可能性的世界。