Перетворення Word у HTML потрібне в різних випадках, наприклад для вбудовування вмісту документа на веб-сторінки. У цій статті ви дізнаєтесь, як конвертувати документи MS Word DOCX або DOC у HTML за допомогою Python. Крім того, ви дізнаєтесь, як динамічно керувати перетворенням Word у HTML за допомогою різних параметрів.
- Python Word to HTML Converter API
- Перетворення документа Word на HTML
- Налаштуйте перетворення Word у HTML
Python Word to HTML Converter API
Щоб конвертувати документи Word у HTML, ми будемо використовувати Aspose.Words for Python. Це потужний і багатофункціональний API для створення та роботи з документами Word. Крім того, він забезпечує високоточне перетворення документів Word в інші формати. Aspose.Words for Python доступний на PyPI, і ви можете встановити його за допомогою такої команди pip.
pip install aspose-words
Перетворіть документ Word на HTML у Python
Нижче наведено кроки для перетворення документа Word у файл HTML за допомогою Python.
- Завантажте документ Word за допомогою класу Document.
- Створіть об’єкт класу HtmlSaveOptions.
- Увімкніть експорт ресурсів шрифтів за допомогою властивості HtmlSaveOptions.exportfontresources.
- Перетворіть документ Word на HTML за допомогою методу Document.save().
У наведеному нижче прикладі коду показано, як перетворити файл DOCX на HTML у Python.
import aspose.words as aw
# Завантажте документ з диска
doc = aw.Document("Document.docx")
# Увімкнути експорт шрифтів
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
# Збережіть документ як HTML
doc.save("Document.html", options)
Налаштуйте перетворення Word у HTML у Python
Aspose.Words for Python також надає різні параметри для налаштування перетворення Word у HTML. Наприклад, можна конвертувати документи з двосторонньою інформацією, вказати папку для збереження файлів ресурсів тощо.
Перетворіть документ Word за допомогою інформації про передачу даних
HTML не підтримує всі функції, надані MS Word, тому, щоб імітувати документ Word у HTML, нам потрібно зберегти додаткову інформацію, яка називається інформацією про зворотне перенесення. Нижче наведено кроки, щоб увімкнути експорт двосторонньої інформації в Word для перетворення HTML.
- Завантажте документ Word за допомогою класу Document.
- Створіть об’єкт класу HtmlSaveOptions і встановіть для властивості HtmlSaveOptions.exportroundtripinformation значення true.
- Перетворіть документ Word на HTML за допомогою методу Document.save() і передайте ім’я HTML-файлу та HtmlSaveOptions як параметри.
У наведеному нижче прикладі коду показано, як експортувати інформацію про передачу в Word у формат HTML.
import aspose.words as aw
# Завантажте документ з диска
doc = aw.Document("Document.docx")
# Увімкнути інформацію про поїздку туди й назад
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True
# Збережіть документ як HTML
doc.save("Document.html", saveOptions)
Word to HTML: укажіть папку для ресурсів
Ви також можете вказати папку, де ви хочете зберігати всі ресурси, такі як зображення, файли CSS і шрифти. Для цього можна використовувати властивість HtmlSaveOptions.exportfontresources. Ви також можете вказати окремі папки для шрифтів і зображень за допомогою властивостей HtmlSaveOptions.fontsfolder і HtmlSaveOptions.imagesfolder відповідно. Нижче наведено кроки для використання окремої папки для збереження ресурсів у програмі Word для перетворення HTML.
- Завантажте документ Word за допомогою класу Document.
- Створіть об’єкт класу HtmlSaveOptions і встановіть для властивості HtmlSaveOptions.exportfontresources значення true.
- Укажіть назву папки ресурсу за допомогою властивості HtmlSaveOptions.resourcefolder.
- Перетворіть документ Word на HTML за допомогою методу Document.save() і передайте ім’я HTML-файлу та HtmlSaveOptions як параметри.
У наведеному нижче прикладі коду показано, як указати папку ресурсів у програмі Word для перетворення HTML.
import aspose.words as aw
# Завантажте документ з диска
doc = aw.Document("Document.docx")
# Вкажіть папку ресурсу
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"
# Збережіть документ як HTML
doc.save("Document.html", saveOptions)
Отримайте безкоштовну ліцензію API
Ви можете отримати тимчасову ліцензію, щоб використовувати Aspose.Words for Python без оціночних обмежень.
Висновок
У цій статті ви дізналися, як конвертувати документи Word у HTML за допомогою Python. Крім того, ви бачили, як динамічно налаштовувати перетворення Word у HTML. Крім того, ви можете дослідити інші функції Aspose.Words for Python за допомогою документації. Ви також можете поставити свої запитання через наш форум.
Дивись також
Інформація: Вас може зацікавити інший API Python (Aspose.Slides for Python через NET), який дозволяє перетворювати презентації на зображення та імпортувати зображення в презентації.