Markdown(MD)は、記事、ブログ、ドキュメントなどを書くために使用される一般的な形式です。ただし、Markdown構文を覚えて書くことが難しくなる場合があります。このような場合、Word文書にコンテンツを書き込んで、それをMarkdownに変換するだけです。 WordからMarkdownへの変換を自動化するために、この記事では、Pythonを使用してWord(.docxまたは.doc)ドキュメントをMarkdown(.md)ファイルに変換する方法について説明します。
Python Word toMarkdownConverterライブラリ
DOCXまたはDOCファイルをMarkdown形式に変換するために、Aspose.Words for Pythonを使用します。 APIを使用すると、Pythonアプリケーション内からワードプロセッシング機能を自動化できます。新しいWord文書を最初から作成し、既存の文書をシームレスに操作または変換できます。 Aspose.Words for Pythonは、PyPIでホストされており、次のpipコマンドを使用してインストールできます。
pip install aspose-words
PythonでWordをMarkdownに変換する
以下は、WordDOCXをMarkdown形式に変換する手順です。
- Documentクラスを使用してWord文書をロードします。
- Document.save(string)メソッドを使用してWord文書をMarkdownに変換します。
次のコードサンプルは、Pythonを使用してDOCXファイルをMarkdown形式に変換する方法を示しています。
import aspose.words as aw
# load document
doc = aw.Document("document.docx")
# save as markdown file
doc.save("document.md")
WordからMarkdownへの変換をカスタマイズする
Aspose.Wordsでは、さまざまなオプションを使用してWordからMarkdownへの変換を制御することもできます。たとえば、テーブルのコンテンツを揃えたり、画像を保存するフォルダを指定したりできます。次の手順は、Pythonを使用したWordからMarkdownへの変換でこれらのオプションを使用する方法を示しています。
- Documentクラスを使用してWord文書をロードします。
- MarkdownSaveOptionsクラスのオブジェクトを作成します。
- MarkdownSaveOptions.imagesfolderなどの必要なオプションを設定します。
- Document.save(string, MarkdownSaveOptions)メソッドを使用してWord文書をマークダウンに変換します。
次のコードサンプルは、Pythonを使用してDOCXからMarkdownへの変換で追加のオプションを設定する方法を示しています。
import aspose.words as aw
# load document
doc = aw.Document("document.docx")
# set options
saveOptions = aw.saving.MarkdownSaveOptions()
saveOptions.images_folder = "Images"
# save as markdown file
doc.save("document.md", saveOptions)
無料のAPIライセンスを取得する
無料の一時ライセンスを使用して、評価の制限なしにAspose.Words for Pythonを使用します。
結論
この記事では、Pythonを使用してWord文書をMarkdown(.md)に変換する方法を学びました。さらに、さまざまなオプションを使用してWordからMarkdownへの変換を制御する方法を見てきました。さらに、Aspose.Words for Pythonのドキュメントにアクセスして、他の機能を調べることができます。 フォーラムから質問することもできます。
関連項目
情報:プレゼンテーションを(PDF、ワードドキュメントなどに)変換したり[画像をインポート]したりできる別のPython API(Aspose.Slides for Python via .NET)に興味があるかもしれません。 8または他のドキュメントをプレゼンテーションに。