PythonでWordをMarkdownに変換する

Markdown(MD)は、記事、ブログ、ドキュメントなどを書くために使用される一般的な形式です。ただし、Markdown構文を覚えて書くことが難しくなる場合があります。このような場合、Word文書にコンテンツを書き込んで、それをMarkdownに変換するだけです。 WordからMarkdownへの変換を自動化するために、この記事では、Pythonを使用してWord(.docxまたは.doc)ドキュメントをMarkdown(.md)ファイルに変換する方法について説明します。

Python Word toMarkdownConverterライブラリ

DOCXまたはDOCファイルをMarkdown形式に変換するために、Aspose.Words for Pythonを使用します。 APIを使用すると、Pythonアプリケーション内からワードプロセッシング機能を自動化できます。新しいWord文書を最初から作成し、既存の文書をシームレスに操作または変換できます。 Aspose.Words for Pythonは、PyPIでホストされており、次のpipコマンドを使用してインストールできます。

pip install aspose-words 

PythonでWordをMarkdownに変換する

以下は、WordDOCXをMarkdown形式に変換する手順です。

  • Documentクラスを使用してWord文書をロードします。
  • Document.save(string)メソッドを使用してWord文書をMarkdownに変換します。

次のコードサンプルは、Pythonを使用してDOCXファイルをMarkdown形式に変換する方法を示しています。

import aspose.words as aw

# load document
doc = aw.Document("document.docx")

# save as markdown file
doc.save("document.md")

WordからMarkdownへの変換をカスタマイズする

Aspose.Wordsでは、さまざまなオプションを使用してWordからMarkdownへの変換を制御することもできます。たとえば、テーブルのコンテンツを揃えたり、画像を保存するフォルダを指定したりできます。次の手順は、Pythonを使用したWordからMarkdownへの変換でこれらのオプションを使用する方法を示しています。

  • Documentクラスを使用してWord文書をロードします。
  • MarkdownSaveOptionsクラスのオブジェクトを作成します。
  • MarkdownSaveOptions.imagesfolderなどの必要なオプションを設定します。
  • Document.save(string, MarkdownSaveOptions)メソッドを使用してWord文書をマークダウンに変換します。

次のコードサンプルは、Pythonを使用してDOCXからMarkdownへの変換で追加のオプションを設定する方法を示しています。

import aspose.words as aw

# load document
doc = aw.Document("document.docx")

# set options
saveOptions = aw.saving.MarkdownSaveOptions()
saveOptions.images_folder = "Images" 

# save as markdown file
doc.save("document.md", saveOptions)

無料のAPIライセンスを取得する

無料の一時ライセンスを使用して、評価の制限なしにAspose.Words for Pythonを使用します。

結論

この記事では、Pythonを使用してWord文書をMarkdown(.md)に変換する方法を学びました。さらに、さまざまなオプションを使用してWordからMarkdownへの変換を制御する方法を見てきました。さらに、Aspose.Words for Pythonのドキュメントにアクセスして、他の機能を調べることができます。 フォーラムから質問することもできます。

関連項目

情報:プレゼンテーションを(PDF、ワードドキュメントなどに)変換したり[画像をインポート]したりできる別のPython API(Aspose.Slides for Python via .NET)に興味があるかもしれません。 8または他のドキュメントをプレゼンテーションに。