Слово в HTML Python

Преобразование Word в HTML требуется в различных случаях, например, для встраивания содержимого документа на веб-страницы. В этой статье вы узнаете, как конвертировать документы MS Word DOCX или DOC в HTML с помощью Python. Кроме того, вы узнаете, как динамически управлять преобразованием Word в HTML, используя различные параметры.

API конвертера Python Word в HTML

Чтобы преобразовать документы Word в HTML, мы будем использовать Aspose.Words for Python. Это мощный и многофункциональный API для создания документов Word и управления ими. Кроме того, он обеспечивает высокоточное преобразование документов Word в другие форматы. Aspose.Words for Python доступен на PyPI, и вы можете установить его с помощью следующей команды pip.

pip install aspose-words 

Преобразование документа Word в HTML в Python

Ниже приведены шаги для преобразования документа Word в файл HTML с помощью Python.

  • Загрузите документ Word, используя класс Document.
  • Создайте объект класса HtmlSaveOptions.
  • Включите экспорт ресурсов шрифтов с помощью свойства HtmlSaveOptions.exportfontresources.
  • Преобразуйте документ Word в HTML, используя метод Document.save().

В следующем примере кода показано, как преобразовать файл DOCX в HTML в Python.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Enable export of fonts
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
  
# Save the document as HTML
doc.save("Document.html", options)

Настройте преобразование Word в HTML в Python

Aspose.Words for Python также предоставляет различные параметры для настройки преобразования Word в HTML. Например, вы можете конвертировать документы с двусторонней информацией, указать папку для сохранения файлов ресурсов и так далее.

Преобразование документа Word с двусторонней информацией

HTML не поддерживает все функции, предоставляемые MS Word, поэтому для имитации документа Word в HTML нам необходимо сохранить дополнительную информацию, называемую двусторонней информацией. Ниже приведены шаги, чтобы включить экспорт информации о передаче данных в преобразовании Word в HTML.

  • Загрузите документ Word, используя класс Document.
  • Создайте объект класса HtmlSaveOptions и задайте для свойства HtmlSaveOptions.exportroundtripinformation значение true.
  • Преобразуйте документ Word в HTML с помощью метода Document.save() и передайте имя HTML-файла и HtmlSaveOptions в качестве параметров.

В следующем образце кода показано, как экспортировать информацию о цикле приема-передачи при преобразовании Word в HTML.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Enable round-trip information
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True 

# Save the document as HTML
doc.save("Document.html", saveOptions)

Word в HTML: укажите папку для ресурсов

Вы также можете указать папку, в которой хотите хранить все ресурсы, такие как изображения, файлы CSS и шрифты. Для этого вы можете использовать свойство HtmlSaveOptions.exportfontresources. Вы также можете указать отдельные папки для шрифтов и изображений, используя свойства HtmlSaveOptions.fontsfolder и HtmlSaveOptions.imagesfolder соответственно. Ниже приведены шаги по использованию отдельной папки для сохранения ресурсов при преобразовании Word в HTML.

  • Загрузите документ Word, используя класс Document.
  • Создайте объект класса HtmlSaveOptions и установите для свойства HtmlSaveOptions.exportfontresources значение true.
  • Укажите имя папки ресурсов с помощью свойства HtmlSaveOptions.resourcefolder.
  • Преобразуйте документ Word в HTML с помощью метода Document.save() и передайте имя HTML-файла и HtmlSaveOptions в качестве параметров.

В следующем примере кода показано, как указать папку ресурсов при преобразовании Word в HTML.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Specify resource folder
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"

# Save the document as HTML
doc.save("Document.html", saveOptions)

Получите бесплатную лицензию API

Вы можете получить временную лицензию, чтобы использовать Aspose.Words for Python без ограничений на пробную версию.

Вывод

В этой статье вы узнали, как конвертировать документы Word в HTML с помощью Python. Кроме того, вы видели, как динамически настраивать преобразование Word в HTML. Кроме того, вы можете изучить другие возможности Aspose.Words для Python с помощью документации. Также вы можете задать свои вопросы на нашем форуме.

Смотрите также

Информация: вас может заинтересовать другой Python API (Aspose.Slides for Python через NET), который позволяет вам преобразовывать презентации в изображения и импортировать изображения в презентации.