Markdown (MD) — популярный формат, который используется для написания статей, блогов, документации и т. д. Однако иногда бывает сложно запомнить и написать синтаксис Markdown. В таких случаях вы можете просто написать содержимое в документе Word и преобразовать его в Markdown. Чтобы автоматизировать преобразование Word в Markdown, в этой статье рассказывается, как преобразовать документы Word (.docx или .doc) в файлы Markdown (.md) с помощью Python.
- Библиотека конвертера Python Word в Markdown
- Преобразование документа Word в Markdown
- Настроить преобразование Word в Markdown
Библиотека конвертера Python Word в Markdown
Чтобы преобразовать файлы DOCX или DOC в формат Markdown, мы будем использовать Aspose.Words for Python. API позволяет автоматизировать функции обработки текста из приложений Python. Вы можете создавать новые документы Word с нуля и беспрепятственно изменять или преобразовывать существующие. Aspose.Words for Python размещен на PyPI и может быть установлен с помощью следующей команды pip.
pip install aspose-words
Преобразование Word в Markdown в Python
Ниже приведены шаги для преобразования Word DOCX в формат Markdown.
- Загрузите документ Word, используя класс Document.
- Преобразуйте документ Word в Markdown, используя метод Document.save(string).
В следующем примере кода показано, как преобразовать файл DOCX в формат Markdown с помощью Python.
import aspose.words as aw
# load document
doc = aw.Document("document.docx")
# save as markdown file
doc.save("document.md")
Настроить преобразование Word в Markdown
Aspose.Words также позволяет вам управлять преобразованием Word в Markdown, используя различные параметры. Например, вы можете выровнять содержимое в таблицах, указать папку для сохранения изображений и так далее. Следующие шаги демонстрируют, как использовать эти параметры при преобразовании Word в Markdown с помощью Python.
- Загрузите документ Word, используя класс Document.
- Создайте объект класса MarkdownSaveOptions.
- Установите нужные параметры, такие как MarkdownSaveOptions.imagesfolder.
- Преобразуйте документ Word в уценку, используя метод Document.save(string, MarkdownSaveOptions).
В следующем примере кода показано, как установить дополнительные параметры преобразования DOCX в Markdown с помощью Python.
import aspose.words as aw
# load document
doc = aw.Document("document.docx")
# set options
saveOptions = aw.saving.MarkdownSaveOptions()
saveOptions.images_folder = "Images"
# save as markdown file
doc.save("document.md", saveOptions)
Получите бесплатную лицензию API
Используйте Aspose.Words for Python без оценочных ограничений, используя бесплатную временную лицензию.
Вывод
В этой статье вы узнали, как конвертировать документы Word в формат Markdown (.md) с помощью Python. Кроме того, вы увидели, как управлять преобразованием Word в Markdown с помощью различных параметров. Кроме того, вы можете посетить документацию Aspose.Words for Python, чтобы изучить другие функции. Вы также можете задать свои вопросы на нашем форуме.
Смотрите также
Информация: вас может заинтересовать другой Python API (Aspose.Slides for Python через NET), который позволяет преобразовывать презентации (в PDF-файлы, текстовые документы и т. д.) и [импортировать изображения]. 8 или другие документы в презентации.