Java で Word を TXT に変換する | DOCXからTXTへの変換 | Java Wordからテキストへ

場合によっては、データをある形式から別の形式にエクスポートする必要がある場合があります。一般的な要件の 1 つは、Word 文書 (DOC または DOCX) をプレーン テキスト (TXT) ファイルに変換することです。この記事では、Java Word to Text Converter ライブラリを使用して Word を TXT に変換する方法を学びます。

この記事では次のトピックについて説明します。

Java Word からテキストへのコンバーター ライブラリ

Aspose.Words for Java は、Java プログラムでドキュメントを操作する必要がある開発者向けの強力なライブラリです。これにより、開発者は Java アプリケーションでプログラムによってドキュメントを作成、編集、変換できます。これは、Microsoft Word を必要とせずにドキュメントを操作するためのツールセットと考えることができます。このライブラリを使用して、Word 文書をプレーン テキスト ファイルに変換します。 Aspose.Words for Java ライブラリを利用すると、DOC または DOCX ファイルを TXT 形式に簡単に変換でき、Word 文書からテキストを抽出して単純なテキスト ファイルとして保存できます。

API の JAR をダウンロード するか、Maven ベースの Java アプリケーションに次の pom.xml 設定を追加してください。

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://releases.aspose.com/java/repo/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>24.3</version>
        <classifier>jdk17</classifier>
    </dependency>
<dependencies>

Word DOCをTXTに変換する手順

以下の簡単な手順に従って、Word 文書からテキストをエクスポートし、TXT 形式で保存できます。

  • Word DOC/DOCX ファイルをロードします。
  • TXT形式に変換します。
  • ファイルを目的の場所に保存します。

Word 文書全体を 1 行ずつ、またはページごとに手動で処理する必要はありません。 Java ライブラリを活用してテキスト コンテンツを効率的に抽出できます。 Java でこれを実現する方法を見てみましょう。

JavaでWord DOCをTXTに変換する

以下の手順に従って、Word (DOC または DOCX) ドキュメントを Java の TXT ファイルに簡単に変換できます。

  • まず、Document クラスを使用して Word DOC/DOCX を読み込みます。
  • 次に、Document.save(filePath) メソッドを使用してドキュメントを TXT ファイルとして保存します。

次のコード サンプルは、Java で Word 文書を TXT 形式に変換する方法を示しています。

// このコード例は、DOCX ファイルを TXT として保存する方法を示しています。
// Wordファイルをロードする
Document doc = new Document("D:\\Files\\document.docx");

// 文書をTXTファイルとして保存
doc.save("D:\\Files\\doc-to-text.txt");
JavaでWord DOCをTXTに変換する

JavaでWord DOCをTXTに変換する

無料ライセンスを取得する

評価制限なしで Word ファイルを TXT 形式に変換するための 無料の一時ライセンス を取得できます。

オンラインでWordをTXTに変換する

この無料の Word to Text Converter を使用して、オンラインで DOCX を TXT に変換することもできます。テキスト コンテンツを Word 文書からプレーン テキスト形式に、高品質かつ正確に迅速にエクスポートします。

DOCX から TXT へ – 無料リソース

DOC または DOCX ファイルを TXT 形式に変換するだけでなく、Aspose.Words for Java の可能性を最大限に引き出します。次のリソースを使用して、ドキュメントの作成、編集、管理、変換などの高度な機能を探索します。

結論

このブログ投稿では、Word 文書からテキスト コンテンツを抽出し、プレーン テキスト ファイルとして保存することで、Word をテキストに変換する方法を学習しました。 Java での Word から TXT への変換は、Aspose.Words for Java ライブラリを使用して実行できる簡単なタスクです。したがって、次回 Word 文書をプレーン テキストに変換する必要がある場合は、上記のコード サンプルをスターター アプリケーションとして使用できます。不明な点がある場合は、無料サポート フォーラムまでお気軽にお問い合わせください。

関連項目