C#でWordをMarkdownに変換する

現在、Markdown(MD)形式は、オンラインの記事、ブログ、およびドキュメントを作成するために広く選択されています。ただし、大きなサイズのドキュメントの場合、その構文を覚えたり書いたりするのは難しくなります。作業を簡単にするために、MS Wordでコンテンツを記述してから、DOCXまたはDOCファイルをMarkdownに変換できます。この変換をプログラムで実行するために、この記事では、Javaを使用してWord文書をMarkdown(.md)ファイルに変換する方法について説明します。

JavaWordからMarkdownへのコンバータライブラリ

DOCX / DOCファイルをMarkdown形式に変換するには、Aspose.Words for Javaを使用します。上記のAPIを使用すると、Javaアプリケーション内からWord文書を作成および操作できます。また、MSWord文書を他の形式に変換するための高品質の文書コンバーターを提供します。 APIのJARをダウンロードするか、次のMaven構成を使用してインストールできます。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

JavaでWord文書をMarkdownに変換する

以下は、JavaでWordDOCXファイルをMarkdown形式に変換する手順です。

  • Documentクラスを使用してWordファイルをロードします。
  • Document.save(string)メソッドを使用して、WordファイルをMarkdown形式に変換します。

次のコードサンプルは、Javaを使用してDOCXファイルをMarkdown形式に変換する方法を示しています。

// ディスクからWord文書をロードする
Document doc = new Document("document.docx");

// ドキュメントをマークダウン形式で保存します
doc.save("word-to-markdown.md");

WordからMarkdownへの変換をカスタマイズする

WordからMarkdownへの変換のAPIのデフォルトの動作を変更することもできます。たとえば、テーブル内のコンテンツの配置を設定したり、画像を保持するフォルダを指定したりできます。以下は、WordからMarkdownへの変換でさまざまなオプションを設定する手順です。

次のコードサンプルは、Javaを使用してDOCXからMarkdownへの変換をカスタマイズする方法を示しています。

// ディスクからWord文書をロードする
Document doc = new Document("document.docx");

// マークダウンオプションを設定する
MarkdownSaveOptions so = new MarkdownSaveOptions();
so.setImagesFolder("D:\\Images");

// ドキュメントをマークダウン形式で保存します
doc.save("word-to-markdown.md", so);

無料のAPIライセンスを取得する

一時ライセンスを使用すると、評価の制限なしにAspose.WordsforJavaを使用できます。

結論

この記事では、JavaでWord DOCX / DOCファイルをプログラムでMarkdown(.md)に変換する方法を学びました。さらに、さまざまなオプションを使用してWordからMarkdownへの変換を変更する方法を見てきました。 ドキュメントを使用して、Aspose.WordsforJavaが提供する他の機能を調べることもできます。また、フォーラムからお気軽にご質問ください。

関連項目