C#でWordをMarkdownに変換する

最近では、多くの記事、ブログ、ドキュメントがMarkdown(MD)形式で書かれています。ただし、Markdown構文は、大きなサイズのドキュメントの場合、覚えたり書いたりするのが難しくなることがよくあります。作業を簡単にするために、MS Wordでコンテンツを記述してから、DOCXまたはDOCドキュメントをMarkdownに変換できます。 WordからMarkdownへの変換を自動化するために、この記事では、C#を使用してWord文書をMarkdown(.md)ファイルに変換する方法について説明します。

C#Word toMarkdownConverterライブラリ

Aspose.Words for .NETは、.NETアプリケーション内からWord文書を作成および操作するように設計されています。さらに、MSWord文書を他の形式に変換するための組み込みのコンバーターを提供します。このAPIを使用して、Word文書をMarkdown形式に変換します。 APIのDLLをダウンロードするか、パッケージマネージャーコンソールを使用してNuGetからインストールできます。

PM> Install-Package Aspose.Words

C#でWord文書をMarkdownに変換する

以下は、Word DOCXファイルをC#でMarkdown形式に変換する手順です。

  • Documentクラスを使用してWordファイルをロードします。
  • Document.Save(string)メソッドを使用して、WordファイルをMarkdown形式に変換します。

次のコードサンプルは、C#を使用してDOCXファイルをMarkdown形式に変換する方法を示しています。

// Wordドキュメントを読み込む
Document doc = new Document("document.docx");

// ドキュメントをマークダウン形式で保存します
doc.Save("word-to-markdown.md");

WordからMarkdownへの変換をカスタマイズする

さまざまなオプションを使用して、WordからMarkdownへの変換のデフォルトの動作をカスタマイズすることもできます。たとえば、テーブル内のコンテンツの配置を設定したり、画像を保持するフォルダを指定したりできます。以下は、WordからMarkdownへの変換をカスタマイズする手順です。

次のコードサンプルは、C#を使用してDOCXからMarkdownへの変換をカスタマイズする方法を示しています。

// Wordドキュメントを読み込む
Document doc = new Document("document.docx");

// マークダウンオプションを設定する
MarkdownSaveOptions so = new MarkdownSaveOptions();
so.ImagesFolder = "D:\\Images";

// ドキュメントをマークダウン形式で保存します
doc.Save("word-to-markdown.md", so);

無料のAPIライセンスを取得する

一時ライセンスを使用すると、評価の制限なしにAspose.Words for .NETを使用できます。

結論

この記事では、Word DOCX / DOCファイルをC#でMarkdown(.md)に変換する方法を学びました。さらに、さまざまなオプションを使用してWordからMarkdownへの変換をカスタマイズする方法を見てきました。 ドキュメントを使用して、Aspose.Words for .NETが提供する他の機能を調べることもできます。また、フォーラムからお気軽にご質問ください。

関連項目