Преобразование документов Word в EPUB в Python

EPUB — это популярный формат, который используется для электронных публикаций, известных как электронные книги. Файлы EPUB можно читать на смартфонах, планшетах, ноутбуках и т. д. В различных случаях файлы MS Word конвертируются в EPUB, чтобы сделать документ доступным на нескольких платформах для чтения. Чтобы выполнить это преобразование программно, в этой статье рассказывается, как преобразовать файлы Word DOCX или DOC в EPUB с помощью Python.

Библиотека Python для преобразования Word в EPUB

Чтобы преобразовать файлы DOCX или DOC в формат EPUB, мы будем использовать Aspose.Words for Python. Упомянутая библиотека предоставляет широкий спектр функций для создания документов Word и управления ими. Кроме того, он позволяет конвертировать документы Word в другие форматы с высокой точностью. Aspose.Words for Python можно установить из PyPI с помощью следующей команды pip.

pip install aspose-words 

Преобразование документа Word в EPUB в Python

Ниже приведены шаги для преобразования документа Word в EPUB в Python.

  • Загрузите документ Word, используя класс Document.
  • Преобразуйте Word в EPUB, используя метод Document.save(string).

В следующем примере кода показано, как преобразовать файл DOCX в EPUB в Python.

import aspose.words as aw

# Load the Word document
doc = aw.Document("document.docx")

# Convert Word document to EPUB
doc.save("word-to-epub.epub")

Дополнительные параметры преобразования Word в EPUB в Python

Aspose.Words for Python также предоставляет дополнительные параметры для настройки преобразования Word в EPUB. Например, вы можете установить схему кодирования, включить или отключить экспорт информации о документе и т.д. Для указания этих параметров используется класс HtmlSaveOptions. Ниже приведены шаги по установке этих параметров при преобразовании Word в EPUB.

  • Сначала загрузите документ Word, используя класс Document.
  • Создайте экземпляр класса HtmlSaveOptions.
  • Установите нужные параметры с помощью объекта HtmlSaveOptions.
  • Наконец, конвертируйте Word в EPUB с помощью метода Document.save(string, HtmlSaveOptions).

В следующем примере кода показано, как указать дополнительные параметры преобразования Word в EPUB.

import aspose.words as aw

# Load the Word document
doc = aw.Document("document.docx")

# Create an object for save options
saveOptions = aw.saving.HtmlSaveOptions()

# Set the desired encoding
saveOptions.encoding = "utf-8"

# Specify at what elements to split the internal HTML at. This creates a new HTML within the EPUB 
# which allows you to limit the size of each HTML part. This is useful for readers which cannot read 
# HTML files greater than a certain size e.g 300kb.
saveOptions.document_split_criteria = aw.saving.DocumentSplitCriteria.HEADING_PARAGRAPH

# Enable export of document properties
saveOptions.export_document_properties = True

# Specify save format
saveOptions.save_format = aw.SaveFormat.EPUB

# Convert Word document to EPUB
doc.save("word-to-epub.epub", saveOptions)

Получить бесплатную лицензию

Вы можете получить временную лицензию на использование Aspose.Words for Python без ограничений на пробную версию.

Вывод

В этой статье вы узнали, как конвертировать документы Word в формат EPUB в Python. Кроме того, вы увидели, как использовать различные параметры для динамической настройки преобразования Word в EPUB. Кроме того, вы можете изучить документацию Aspose.Words для Python. Если у вас возникнут какие-либо вопросы, сообщите нам об этом через наш форум.

Смотрите также