文書処理の分野では、Word 文書をより単純なプレーン テキスト形式に変換する必要が生じることがよくあります。データ抽出、コンテンツ分析、互換性の理由を問わず、Word (.doc、.docx) ファイルをプレーン テキスト (.txt) に変換する機能は、開発者にとって貴重なスキルです。このブログ投稿では、C# アプリケーションで Word 文書を TXT 形式に変換する方法を説明します。
Word から TXT への変換のための C# ライブラリ
Aspose.Words for .NET は、開発者がさまざまな形式の Word ドキュメントを操作できるようにする機能が豊富なドキュメント処理ライブラリです。ドキュメントの作成、操作、変換、レンダリングのための一連の API を提供します。このライブラリを使用して、Word 文書からコンテンツをプレーン テキストとして抽出します。
NuGetからライブラリをインストールするには、次のコマンドを使用できます。または、リリース セクションからダウンロードできます。
PM> Install-Package Aspose.Words
Word DOCをTXTに変換する手順
Aspose.Words for .NET を使用すると、Word 文書からテキストを抽出して TXT 形式で保存することが、いくつかの手順で非常に簡単になります。以下は、Word から TXT への変換のために実行する必要がある手順です。
- Word DOC/DOCX ファイルをロードします。
- TXT 形式に変換し、ファイルを目的の場所に保存します。
したがって、Word 文書全体を解析してテキストを 1 行ずつ、またはページごとに抽出する必要はありません。次に、Word 文書からテキストを抽出する C# コードを記述してみましょう。
C# で Word DOC を TXT に変換する
Word DOC または DOCX ドキュメントを C# で TXT ファイルとして保存する手順は次のとおりです。
- まず、Document クラスを使用して Word DOC/DOCX を読み込みます。
- 次に、Document.Save(filePath) メソッドを使用してドキュメントを TXT ファイルとして保存します。
次の C# コード スニペットは、Word ドキュメントを TXT 形式に変換します。
// Wordファイルをロードする
Document doc = new Document("document.docx");
// 文書をTXTファイルとして保存
doc.Save("doc-to-text.txt");
無料の C# Word to TXT コンバーターを使用する
評価制限なしで Word ファイルを TXT 形式に変換するための 無料の一時ライセンス を取得できます。
C# Word ライブラリを探索する
他の機能を調べるには、C# Word ライブラリの ドキュメント にアクセスしてください。ご質問がございましたら、フォーラム 経由でお気軽にお問い合わせください。
結論
このブログ投稿では、Aspose.Words for .NET を使用して C# で Word ドキュメントを TXT ファイルに変換する方法を検討しました。 Word 文書全体を解析する必要はなく、数ステップで文書からプレーン テキストを抽出するだけです。 Aspose.Words は、Word ドキュメントをプログラムで操作するプロセスを簡素化し、ドキュメント変換タスクのための信頼性が高く効率的なソリューションを提供します。このライブラリを C# プロジェクトに統合すると、ドキュメント処理を簡単に処理できるようになり、アプリケーションの可能性が広がります。