EPUB 是一种流行的格式,用于被称为电子书的电子出版物。 EPUB 文件可以在智能手机、平板电脑、笔记本电脑等上阅读。在各种情况下,MS Word 文件被转换为 EPUB 以使文档在多个阅读器平台上可用。为了以编程方式完成此转换,本文介绍了如何使用 Python 将 Word DOCX 或 DOC 文件转换为 EPUB。
用于 Word 到 EPUB 转换的 Python 库
为了将 DOCX 或 DOC 文件转换为 EPUB 格式,我们将使用 Aspose.Words for Python。所述库提供了广泛的功能来创建和操作 Word 文档。此外,它还允许您将 Word 文档转换为其他具有高保真度的格式。 Aspose.Words for Python 可以使用以下 pip 命令从 PyPI 安装。
pip install aspose-words
在 Python 中将 Word 文档转换为 EPUB
以下是在 Python 中将 Word 文档转换为 EPUB 的步骤。
- 使用 Document 类加载 Word 文档。
- 使用 Document.save(string) 方法将 Word 转换为 EPUB。
以下代码示例展示了如何在 Python 中将 DOCX 文件转换为 EPUB。
import aspose.words as aw
# 加载 Word 文档
doc = aw.Document("document.docx")
# 将 Word 文档转换为 EPUB
doc.save("word-to-epub.epub")
Python 中 Word 到 EPUB 的其他选项
Aspose.Words for Python 还提供了额外的选项来自定义 Word 到 EPUB 的转换。例如,您可以设置编码方案、启用或禁用导出文档信息等。要指定这些选项,使用 HtmlSaveOptions 类。以下是在 Word 到 EPUB 转换中设置这些选项的步骤。
- 首先,使用 Document 类加载 Word 文档。
- 创建 HtmlSaveOptions 类的实例。
- 使用 HtmlSaveOptions 对象设置所需的选项。
- 最后,使用 Document.save(string, HtmlSaveOptions) 方法将 Word 转换为 EPUB。
以下代码示例显示了如何在 Word 到 EPUB 的转换中指定其他选项。
import aspose.words as aw
# 加载 Word 文档
doc = aw.Document("document.docx")
# 为保存选项创建一个对象
saveOptions = aw.saving.HtmlSaveOptions()
# 设置所需的编码
saveOptions.encoding = "utf-8"
# 指定在哪些元素处拆分内部 HTML。这会在 EPUB 中创建一个新的 HTML
# 它允许您限制每个 HTML 部分的大小。这对无法阅读的读者很有用
# 大于特定大小的 HTML 文件,例如 300kb。
saveOptions.document_split_criteria = aw.saving.DocumentSplitCriteria.HEADING_PARAGRAPH
# 启用文档属性的导出
saveOptions.export_document_properties = True
# 指定保存格式
saveOptions.save_format = aw.SaveFormat.EPUB
# 将 Word 文档转换为 EPUB
doc.save("word-to-epub.epub", saveOptions)
获得免费许可证
您可以获得 临时许可证 以使用 Aspose.Words for Python,而不受评估限制。
结论
在本文中,您学习了如何在 Python 中将 Word 文档转换为 EPUB 格式。此外,您还了解了如何使用不同的选项来动态自定义 Word 到 EPUB 的转换。除此之外,您还可以探索 Aspose.Words for Python 的文档。如果您有任何问题,请随时通过我们的 论坛 告诉我们。