Преобразование Word в Markdown в Python

Markdown (MD) — популярный формат, который используется для написания статей, блогов, документации и т. д. Однако иногда бывает сложно запомнить и написать синтаксис Markdown. В таких случаях вы можете просто написать содержимое в документе Word и преобразовать его в Markdown. Чтобы автоматизировать преобразование Word в Markdown, в этой статье рассказывается, как преобразовать документы Word (.docx или .doc) в файлы Markdown (.md) с помощью Python.

Библиотека конвертера Python Word в Markdown

Чтобы преобразовать файлы DOCX или DOC в формат Markdown, мы будем использовать Aspose.Words for Python. API позволяет автоматизировать функции обработки текста из приложений Python. Вы можете создавать новые документы Word с нуля и беспрепятственно изменять или преобразовывать существующие. Aspose.Words for Python размещен на PyPI и может быть установлен с помощью следующей команды pip.

pip install aspose-words 

Преобразование Word в Markdown в Python

Ниже приведены шаги для преобразования Word DOCX в формат Markdown.

  • Загрузите документ Word, используя класс Document.
  • Преобразуйте документ Word в Markdown, используя метод Document.save(string).

В следующем примере кода показано, как преобразовать файл DOCX в формат Markdown с помощью Python.

import aspose.words as aw

# load document
doc = aw.Document("document.docx")

# save as markdown file
doc.save("document.md")

Настроить преобразование Word в Markdown

Aspose.Words также позволяет вам управлять преобразованием Word в Markdown, используя различные параметры. Например, вы можете выровнять содержимое в таблицах, указать папку для сохранения изображений и так далее. Следующие шаги демонстрируют, как использовать эти параметры при преобразовании Word в Markdown с помощью Python.

  • Загрузите документ Word, используя класс Document.
  • Создайте объект класса MarkdownSaveOptions.
  • Установите нужные параметры, такие как MarkdownSaveOptions.imagesfolder.
  • Преобразуйте документ Word в уценку, используя метод Document.save(string, MarkdownSaveOptions).

В следующем примере кода показано, как установить дополнительные параметры преобразования DOCX в Markdown с помощью Python.

import aspose.words as aw

# load document
doc = aw.Document("document.docx")

# set options
saveOptions = aw.saving.MarkdownSaveOptions()
saveOptions.images_folder = "Images" 

# save as markdown file
doc.save("document.md", saveOptions)

Получите бесплатную лицензию API

Используйте Aspose.Words for Python без оценочных ограничений, используя бесплатную временную лицензию.

Вывод

В этой статье вы узнали, как конвертировать документы Word в формат Markdown (.md) с помощью Python. Кроме того, вы увидели, как управлять преобразованием Word в Markdown с помощью различных параметров. Кроме того, вы можете посетить документацию Aspose.Words for Python, чтобы изучить другие функции. Вы также можете задать свои вопросы на нашем форуме.

Смотрите также

Информация: вас может заинтересовать другой Python API (Aspose.Slides for Python через NET), который позволяет преобразовывать презентации (в PDF-файлы, текстовые документы и т. д.) и [импортировать изображения]. 8 или другие документы в презентации.