在 Java 中将 Word 文档转换为 EPUB

大多数智能设备,如智能手机、平板电脑、笔记本电脑等,都支持EPUB格式来查看或阅读文档。它是电子书或电子出版物的常用格式。另一方面,MS Word 格式,如 DOCXDOC 等,是数字世界中广泛使用的文档格式之一。在本文中,我们将向您展示如何在 Java 中以编程方式将 MS Word DOC DOCX 转换为 EPUB。此外,您将学习如何使用不同的选项自定义 Word DOC 到 EPUB 的转换。

Java API for Word DOCX DOCX 到 EPUB 转换

为了将 DOCX、DOC 等文件转换为 EPUB 格式,我们将使用 Aspose.Words for Java。上述 API 允许您无缝地创建和操作 MS Word 文档。此外,您可以将 Word 文件高保真转换为其他格式,例如 EPUB、HTML、PDF 等。您可以 下载 API 的 JAR 文件或使用以下配置将其安装到基于 Maven 的应用程序中.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

在 Java 中将 Word DOC 转换为 EPUB - 免费下载

以下是在 Java 中将 Word DOCX 文件转换为 EPUB 的步骤。

以下代码示例展示了如何在 Java 中将 DOCX 文件转换为 EPUB。

// 加载 Word 文档
Document doc = new Document("document.docx");

// 将 Word 文档转换为 EPUB
doc.save("word-to-epub.epub");

在 Java 中自定义 Word DOC 到 EPUB 的转换

您还可以使用不同的选项修改 API 在 Word 到 EPUB 转换中的默认行为。例如,您可以指定编码方案、导出文档信息、设置拆分条件等。以下是在 Java 中自定义 Word DOC 到 EPUB 转换的步骤。

以下代码示例展示了如何在 Java 中自定义 Word DOC 到 EPUB 的转换。

// 加载 Word 文档
Document doc = new Document("document.docx");

// 为保存选项创建一个对象
HtmlSaveOptions saveOptions = new HtmlSaveOptions();

// 设置所需的编码
saveOptions.setEncoding(Charset.forName("UTF-8"));

// 指定在哪些元素处拆分内部 HTML。这会在 EPUB 中创建一个新的 HTML 
// 它允许您限制每个 HTML 部分的大小。这对无法阅读的读者很有用 
// 大于特定大小的 HTML 文件,例如 300kb。
saveOptions.setDocumentSplitCriteria(DocumentSplitCriteria.HEADING_PARAGRAPH);

// 启用文档属性的导出
saveOptions.setExportDocumentProperties(true);

// 指定保存格式
saveOptions.setSaveFormat(SaveFormat.EPUB);

// 将 Word 文档转换为 EPUB
doc.save("word-to-epub.epub", saveOptions);

Java Word DOC 到 EPUB 转换器 - 获得免费许可证

您可以通过获得免费的 临时许可证 来使用 Aspose.Words for Java,而不受评估限制。

结论

在本文中,您学习了如何在 Java 中将 Word DOC DOCX 转换为 EPUB 格式。此外,您还了解了如何使用 Java 中的不同选项修改 Word DOC 到 EPUB 的转换。此外,您还可以访问文档以了解 Aspose.Words for Java 提供的其他内容。如果您有任何困惑或疑问,可以通过我们的 论坛 告诉我们。

也可以看看