Перетворення Word на Markdown у Python

Markdown(MD) — це популярний формат, який використовується для написання статей, блогів, документації тощо. Однак іноді стає важко запам’ятати та написати синтаксис Markdown. У таких випадках ви можете просто записати вміст у документ Word і конвертувати його у Markdown. Щоб автоматизувати перетворення Word у Markdown, у цій статті описано, як конвертувати документи Word (.docx або .doc) у файли Markdown (.md) за допомогою Python.

Бібліотека конвертера Python Word to Markdown

Щоб конвертувати файли DOCX або DOC у формат Markdown, ми будемо використовувати Aspose.Words for Python. API дозволяє автоматизувати функції обробки тексту з програм Python. Ви можете створювати нові документи Word з нуля та плавно маніпулювати наявними або конвертувати їх. Aspose.Words for Python розміщено на PyPI і може бути встановлено за допомогою такої команди pip.

pip install aspose-words 

Перетворення Word на Markdown у Python

Нижче наведено кроки для перетворення Word DOCX у формат Markdown.

  • Завантажте документ Word за допомогою класу Document.
  • Перетворіть документ Word у Markdown за допомогою методу Document.save(string).

У наведеному нижче прикладі коду показано, як конвертувати файл DOCX у формат Markdown за допомогою Python.

import aspose.words as aw

# завантажити документ
doc = aw.Document("document.docx")

# зберегти як файл розмітки
doc.save("document.md")

Налаштуйте перетворення Word у Markdown

Aspose.Words також дозволяє керувати перетворенням Word у Markdown за допомогою різних параметрів. Наприклад, ви можете вирівняти вміст у таблицях, вказати папку для збереження зображень тощо. Наступні кроки демонструють, як використовувати ці параметри в перетворенні Word у Markdown за допомогою Python.

  • Завантажте документ Word за допомогою класу Document.
  • Створіть об’єкт класу MarkdownSaveOptions.
  • Встановіть потрібні параметри, наприклад MarkdownSaveOptions.imagesfolder.
  • Перетворіть документ Word на розмітку за допомогою методу Document.save(string, MarkdownSaveOptions).

У наведеному нижче прикладі коду показано, як установити додаткові параметри в DOCX для перетворення Markdown за допомогою Python.

import aspose.words as aw

# завантажити документ
doc = aw.Document("document.docx")

# встановити параметри
saveOptions = aw.saving.MarkdownSaveOptions()
saveOptions.images_folder = "Images" 

# зберегти як файл розмітки
doc.save("document.md", saveOptions)

Отримайте безкоштовну ліцензію API

Використовуйте Aspose.Words for Python без оціночних обмежень за допомогою безкоштовної тимчасової ліцензії.

Висновок

У цій статті ви дізналися, як конвертувати документи Word у Markdown (.md) за допомогою Python. Крім того, ви бачили, як керувати перетворенням Word у Markdown за допомогою різних параметрів. Крім того, ви можете відвідати документацію Aspose.Words for Python, щоб дослідити інші функції. Ви також можете поставити свої запитання через наш форум.

Дивись також

Інформація: вас може зацікавити інший API Python (Aspose.Slides for Python через NET), який дозволяє конвертувати презентації (у PDF-файли, документи Word тощо) та імпортувати зображення або інші документи в презентації.