拆分 Word 文档 Java

在各种情况下,您需要将一个 MS Word 文档拆分为多个文档。例如,您可能需要为 Word 文档中的每个页面、部分或页面集合创建单独的文档。为了自动化文档拆分,本文介绍了如何使用 Java 以编程方式拆分 MS Word DOCX。以下部分提供了上述拆分标准的分步教程和代码示例。

Java API 用于拆分 Word DOCX

Aspose.Words for Java 是一个功能强大且功能丰富的文档操作 API,可让您创建和处理 MS Word 文档。除了基本和高级 Word 自动化功能外,API 还允许您将 Word 文档拆分为多个文档。您可以 下载 API 或使用以下配置将其安装在基于 Maven 的应用程序中。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.1</version>
    <classifier>jdk17</classifier>
</dependency>

Word 文档拆分器 - 助手类

在开始拆分文档之前,您需要将以下帮助程序类添加到您的项目中,该类实现基于 Aspose.Words for Java 的 Java 文档拆分器。添加类后,您可以使用以下部分中提供的代码示例继续拆分文档。

使用 Java 拆分 Word DOCX

首先,让我们看看如何按页拆分 MS Word 文档。在这种情况下,源文档的每一页都将转换为单独的 Word 文档。以下是拆分 Word 文档页面的步骤。

以下代码示例显示了如何使用 Java 拆分 Word 文档。

// 如需完整的示例和数据文件,请访问 https://github.com/aspose-words/Aspose.Words-for-Java
// 打开一个 Word 文档
Document doc = new Document("Word.docx");

// 将文档中的节点拆分为单独的页面
DocumentPageSplitter splitter = new DocumentPageSplitter(doc);

// 将每个页面保存为单独的文档
for (int page = 1; page <= doc.getPageCount(); page++)
{
    Document pageDoc = splitter.getDocumentOfPage(page);
    pageDoc.save("SplitDocumentByPage_" + page + ".docx");
}

在 Java 中使用页面范围拆分 Word DOCX

您还可以定义要从源 Word 文档中拆分的页面范围。以下是执行此操作的步骤。

以下代码示例展示了如何使用 Java 按页面范围拆分 Word 文档。

// 如需完整的示例和数据文件,请访问 https://github.com/aspose-words/Aspose.Words-for-Java
// 打开一个 Word 文档
Document doc = new Document("Word.docx");

// 将文档中的节点拆分为单独的页面
DocumentPageSplitter splitter = new DocumentPageSplitter(doc);
 
// 获取文档的一部分
Document pageDoc = splitter.getDocumentOfPageRange(3,6);
pageDoc.save("SplitDocumentByPageRange.docx");

使用 Java 按部分拆分 Word 文档

Aspose.Words for Java 还允许您按分节符拆分 Word 文档。以下是执行此操作的步骤。

以下代码示例显示了如何使用 Java 按部分拆分 Word 文档。

// 加载 Word DOCX 文档
Document doc = new Document("word.docx");

for (int i = 0; i < doc.getSections().getCount(); i++) {
	// 将文档拆分成更小的部分,在这种情况下按部分拆分
	Section section = doc.getSections().get(i).deepClone();

	// 创建一个新文档
	Document newDoc = new Document();
	newDoc.getSections().clear();

  	// 添加部分
	Section newSection = (Section) newDoc.importNode(section, true);
	newDoc.getSections().add(newSection);

	// 将每个部分保存为单独的文档
	newDoc.save("splitted_" + i + ".docx");
}

获取免费 API 许可证

您可以 获得免费的临时许可证 以便在没有评估限制的情况下试用 API。

结论

在本文中,您学习了如何使用 Java 拆分 MS Word DOCX/DOC。分步指南和代码示例展示了如何按部分、页面或页面范围拆分 Word 文档。您可以使用 documentation 探索有关 Java Word API 的更多信息。

也可以看看