在 Python 中将 Word 文档转换为 EPUB

EPUB 是一种流行的格式,用于被称为电子书的电子出版物。 EPUB 文件可以在智能手机、平板电脑、笔记本电脑等上阅读。在各种情况下,MS Word 文件被转换为 EPUB 以使文档在多个阅读器平台上可用。为了以编程方式完成此转换,本文介绍了如何使用 Python 将 Word DOCXDOC 文件转换为 EPUB。

用于 Word 到 EPUB 转换的 Python 库

为了将 DOCX 或 DOC 文件转换为 EPUB 格式,我们将使用 Aspose.Words for Python。所述库提供了广泛的功能来创建和操作 Word 文档。此外,它还允许您将 Word 文档转换为其他具有高保真度的格式。 Aspose.Words for Python 可以使用以下 pip 命令从 PyPI 安装。

pip install aspose-words 

在 Python 中将 Word 文档转换为 EPUB

以下是在 Python 中将 Word 文档转换为 EPUB 的步骤。

  • 使用 Document 类加载 Word 文档。
  • 使用 Document.save(string) 方法将 Word 转换为 EPUB。

以下代码示例展示了如何在 Python 中将 DOCX 文件转换为 EPUB。

import aspose.words as aw

# 加载 Word 文档
doc = aw.Document("document.docx")

# 将 Word 文档转换为 EPUB
doc.save("word-to-epub.epub")

Python 中 Word 到 EPUB 的其他选项

Aspose.Words for Python 还提供了额外的选项来自定义 Word 到 EPUB 的转换。例如,您可以设置编码方案、启用或禁用导出文档信息等。要指定这些选项,使用 HtmlSaveOptions 类。以下是在 Word 到 EPUB 转换中设置这些选项的步骤。

  • 首先,使用 Document 类加载 Word 文档。
  • 创建 HtmlSaveOptions 类的实例。
  • 使用 HtmlSaveOptions 对象设置所需的选项。
  • 最后,使用 Document.save(string, HtmlSaveOptions) 方法将 Word 转换为 EPUB。

以下代码示例显示了如何在 Word 到 EPUB 的转换中指定其他选项。

import aspose.words as aw

# 加载 Word 文档
doc = aw.Document("document.docx")

# 为保存选项创建一个对象
saveOptions = aw.saving.HtmlSaveOptions()

# 设置所需的编码
saveOptions.encoding = "utf-8"

# 指定在哪些元素处拆分内部 HTML。这会在 EPUB 中创建一个新的 HTML 
# 它允许您限制每个 HTML 部分的大小。这对无法阅读的读者很有用 
# 大于特定大小的 HTML 文件,例如 300kb。
saveOptions.document_split_criteria = aw.saving.DocumentSplitCriteria.HEADING_PARAGRAPH

# 启用文档属性的导出
saveOptions.export_document_properties = True

# 指定保存格式
saveOptions.save_format = aw.SaveFormat.EPUB

# 将 Word 文档转换为 EPUB
doc.save("word-to-epub.epub", saveOptions)

获得免费许可证

您可以获得 临时许可证 以使用 Aspose.Words for Python,而不受评估限制。

结论

在本文中,您学习了如何在 Python 中将 Word 文档转换为 EPUB 格式。此外,您还了解了如何使用不同的选项来动态自定义 Word 到 EPUB 的转换。除此之外,您还可以探索 Aspose.Words for Python 的文档。如果您有任何问题,请随时通过我们的 论坛 告诉我们。

也可以看看