EPUB — это популярный формат, который используется для электронных публикаций, известных как электронные книги. Файлы EPUB можно читать на смартфонах, планшетах, ноутбуках и т. д. В различных случаях файлы MS Word конвертируются в EPUB, чтобы сделать документ доступным на нескольких платформах для чтения. Чтобы выполнить это преобразование программно, в этой статье рассказывается, как преобразовать файлы Word DOCX или DOC в EPUB с помощью Python.
- Библиотека Python для преобразования Word в EPUB
- Преобразование документа Word в EPUB
- Дополнительные параметры для преобразования Word в EPUB
Библиотека Python для преобразования Word в EPUB
Чтобы преобразовать файлы DOCX или DOC в формат EPUB, мы будем использовать Aspose.Words for Python. Упомянутая библиотека предоставляет широкий спектр функций для создания документов Word и управления ими. Кроме того, он позволяет конвертировать документы Word в другие форматы с высокой точностью. Aspose.Words for Python можно установить из PyPI с помощью следующей команды pip.
pip install aspose-words
Преобразование документа Word в EPUB в Python
Ниже приведены шаги для преобразования документа Word в EPUB в Python.
- Загрузите документ Word, используя класс Document.
- Преобразуйте Word в EPUB, используя метод Document.save(string).
В следующем примере кода показано, как преобразовать файл DOCX в EPUB в Python.
import aspose.words as aw
# Load the Word document
doc = aw.Document("document.docx")
# Convert Word document to EPUB
doc.save("word-to-epub.epub")
Дополнительные параметры преобразования Word в EPUB в Python
Aspose.Words for Python также предоставляет дополнительные параметры для настройки преобразования Word в EPUB. Например, вы можете установить схему кодирования, включить или отключить экспорт информации о документе и т.д. Для указания этих параметров используется класс HtmlSaveOptions. Ниже приведены шаги по установке этих параметров при преобразовании Word в EPUB.
- Сначала загрузите документ Word, используя класс Document.
- Создайте экземпляр класса HtmlSaveOptions.
- Установите нужные параметры с помощью объекта HtmlSaveOptions.
- Наконец, конвертируйте Word в EPUB с помощью метода Document.save(string, HtmlSaveOptions).
В следующем примере кода показано, как указать дополнительные параметры преобразования Word в EPUB.
import aspose.words as aw
# Load the Word document
doc = aw.Document("document.docx")
# Create an object for save options
saveOptions = aw.saving.HtmlSaveOptions()
# Set the desired encoding
saveOptions.encoding = "utf-8"
# Specify at what elements to split the internal HTML at. This creates a new HTML within the EPUB
# which allows you to limit the size of each HTML part. This is useful for readers which cannot read
# HTML files greater than a certain size e.g 300kb.
saveOptions.document_split_criteria = aw.saving.DocumentSplitCriteria.HEADING_PARAGRAPH
# Enable export of document properties
saveOptions.export_document_properties = True
# Specify save format
saveOptions.save_format = aw.SaveFormat.EPUB
# Convert Word document to EPUB
doc.save("word-to-epub.epub", saveOptions)
Получить бесплатную лицензию
Вы можете получить временную лицензию на использование Aspose.Words for Python без ограничений на пробную версию.
Вывод
В этой статье вы узнали, как конвертировать документы Word в формат EPUB в Python. Кроме того, вы увидели, как использовать различные параметры для динамической настройки преобразования Word в EPUB. Кроме того, вы можете изучить документацию Aspose.Words для Python. Если у вас возникнут какие-либо вопросы, сообщите нам об этом через наш форум.