現在、Markdown(MD)形式は、オンラインの記事、ブログ、およびドキュメントを作成するために広く選択されています。ただし、大きなサイズのドキュメントの場合、その構文を覚えたり書いたりするのは難しくなります。作業を簡単にするために、MS Wordでコンテンツを記述してから、DOCXまたはDOCファイルをMarkdownに変換できます。この変換をプログラムで実行するために、この記事では、Javaを使用してWord文書をMarkdown(.md)ファイルに変換する方法について説明します。
JavaWordからMarkdownへのコンバータライブラリ
DOCX / DOCファイルをMarkdown形式に変換するには、Aspose.Words for Javaを使用します。上記のAPIを使用すると、Javaアプリケーション内からWord文書を作成および操作できます。また、MSWord文書を他の形式に変換するための高品質の文書コンバーターを提供します。 APIのJARをダウンロードするか、次のMaven構成を使用してインストールできます。
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
JavaでWord文書をMarkdownに変換する
以下は、JavaでWordDOCXファイルをMarkdown形式に変換する手順です。
- Documentクラスを使用してWordファイルをロードします。
- Document.save(string)メソッドを使用して、WordファイルをMarkdown形式に変換します。
次のコードサンプルは、Javaを使用してDOCXファイルをMarkdown形式に変換する方法を示しています。
// ディスクからWord文書をロードする
Document doc = new Document("document.docx");
// ドキュメントをマークダウン形式で保存します
doc.save("word-to-markdown.md");
WordからMarkdownへの変換をカスタマイズする
WordからMarkdownへの変換のAPIのデフォルトの動作を変更することもできます。たとえば、テーブル内のコンテンツの配置を設定したり、画像を保持するフォルダを指定したりできます。以下は、WordからMarkdownへの変換でさまざまなオプションを設定する手順です。
- Documentクラスを使用してWordドキュメントをロードします。
- MarkdownSaveOptionsクラスのオブジェクトを作成します。
- MarkdownSaveOptions.setImagesFolder(string)などの必要なオプションを設定します。
- Document.save(string, MarkdownSaveOptions)メソッドを使用して、Word文書をMarkdownに変換します。
次のコードサンプルは、Javaを使用してDOCXからMarkdownへの変換をカスタマイズする方法を示しています。
// ディスクからWord文書をロードする
Document doc = new Document("document.docx");
// マークダウンオプションを設定する
MarkdownSaveOptions so = new MarkdownSaveOptions();
so.setImagesFolder("D:\\Images");
// ドキュメントをマークダウン形式で保存します
doc.save("word-to-markdown.md", so);
無料のAPIライセンスを取得する
一時ライセンスを使用すると、評価の制限なしにAspose.WordsforJavaを使用できます。
結論
この記事では、JavaでWord DOCX / DOCファイルをプログラムでMarkdown(.md)に変換する方法を学びました。さらに、さまざまなオプションを使用してWordからMarkdownへの変換を変更する方法を見てきました。 ドキュメントを使用して、Aspose.WordsforJavaが提供する他の機能を調べることもできます。また、フォーラムからお気軽にご質問ください。