C# 中的文档拆分

拆分文档是信息管理和数据处理的一项基本任务。它涉及将冗长的文本或文件战略性地划分为更小、更易于管理的部分。最常见的是,文档按每个页面或一系列页面进行分割。无论是处理大量研究论文、大量报告还是数据集,文档拆分过程都有助于高效组织。本文将向您介绍用于在 C# 中以编程方式拆分文档的 API 的终极集合。因此,您将能够拆分 Word、PDF、Excel 和 PowerPoint 格式的文档。

用于分割文档的 C# API

Aspose 是强大且多功能 API 的领先提供商,旨在简化高效、精确的文档分割过程。在管理和操作大型复杂文件是一项复杂任务的世界中,Aspose 的尖端 API 提供了强大的解决方案。无论是处理文本文档、电子表格还是综合演示文稿,Aspose 的 API 都使开发人员能够轻松地将这些文档划分为更小且更易于管理的组件。那么让我们看一下Aspose的文档分割API,它们在各个行业和应用程序中优化了文档管理。

C# 中的 PDF 文档拆分

C# PDF 分割

便携式文档格式 (PDF) 是一种流行的格式,提供丰富的功能以及在不同系统之间保持一致布局的能力。 PDF 成为共享和打印文档的首选。从小型文档到大型报告,PDF 都被选为主要文档格式。为了在 C# 中分割 PDF,Aspose 提供了 Aspose.PDF for .NET

Aspose.PDF for .NET 简化了 PDF 分割过程,为您提供了灵活的 PDF 文档分割方式。您可以根据您的要求自定义该方法。以下是在 C# 中分割 PDF 的步骤。

  • 安装Aspose.PDF for .NET
  • 使用 Document 类加载 PDF 文档。
  • 循环遍历 Document.Pages 集合以使用 Page 类访问每个页面。
  • 在每次迭代中,创建一个新文档,将当前页面添加到文档中,并使用 Document.Save(String) 方法将其保存为 PDF 文件。

以下代码示例演示了 C# 中的 PDF 文档拆分。

// 打开文档
Document pdfDocument = new Document("merged.pdf");

// 用于页计数器
int pageCount = 1;

// 循环浏览所有页面
foreach (Aspose.Pdf.Page pdfPage in pdfDocument.Pages)
{
  	// 创建一个新文档
	Document newDocument = new Document();
  
  	// 将页面添加到文档
	newDocument.Pages.Add(pdfPage);
  
  	// 另存为 PDF 
	newDocument.Save("page_" + pageCount + "_out" + ".pdf");
	pageCount++;
}

阅读有关 使用 C# 拆分 PDF 文档 的完整文章。

使用以下资源开始使用 C# PDF 文档处理 API:

在 C# 中拆分 Word 文档

C# 分词

Microsoft Word 已成为生成各种文本文档(包括报告、合同、简历等)的首选且广泛使用的工具。这些文件通常以 DOC/DOCX 格式保存。对于分割 MS Word 文档,Aspose 提供了 Aspose.Words for .NET

Aspose.Words for .NET 是一个功能强大的文字处理库,具有一系列用于创建和操作 Word 文档的功能。凭借其强大的文档处理引擎,该 API 可让您轻松且高精度地执行 Word 文档拆分。那么让我们看看如何使用 Aspose.Words for .NET 在 C# 中拆分 Word 文档。

  • 安装Aspose.Words for .NET
  • 使用 Document 类加载 Word 文档。
  • 创建 DocumentPageSplitter 类的对象并使用 Document 对象对其进行初始化。
  • 遍历文档的页面。
  • 使用 DocumentPageSplitter.GetDocumentOfPage(int PageIndex) 方法将每个页面提取到新的 Document 对象中。
  • 使用 Document.Save(String) 方法保存每个文档。

下面的 C# 代码示例演示了 Word 文档拆分。

// 打开 Word 文档
Document doc = new Document("Document.docx");

// 创建并初始化文档页面分割器
DocumentPageSplitter splitter = new DocumentPageSplitter(doc);

// 将每个页面另存为单独的文档
for (int page = 1; page <= doc.PageCount; page++)
{
	Document pageDoc = splitter.GetDocumentOfPage(page);
	pageDoc.Save($"spliteed_{page}.docx");
}

阅读有关 使用 C# 拆分 Word 文档 的完整文章。

您可以使用下面给出的资源开始使用 C# Word 文档拆分 API。

C# 中的 Excel 电子表格拆分

C# 电子表格拆分

MS Excel 是 MS Office 的另一个流行应用程序,可让您以工作表和工作簿的形式组织和管理表格数据。此外,它还提供各种功能来处理数据、创建视觉表示、执行数值运算等等。对于 C# 中的电子表格拆分,Aspose 提供了 Aspose.Cells for .NET

与上述 API 类似,Aspose.Cells for .NET 也使您可以更简单地从工作簿中拆分工作表并将它们保存为单独的文件。您只需访问所需的工作表并将其拆分为新的电子表格文档。那么让我们用 C# 来执行 Excel 电子表格拆分。

  • 安装Aspose.Cells for .NET
  • 使用 Workbook 类加载 Excel 文件。
  • 创建一个新的工作簿对象。
  • 将工作表从源工作簿复制到新创建的工作簿。
  • 使用 Workbook.Save() 方法保存新工作簿。

下面的代码示例演示了如何在 C# 中拆分 Excel 电子表格。

// 开源 Excel 文件
Workbook sourceWorkbook = new Workbook("source.xlsx");

// 打开目标 Excel 文件
Workbook newWorkbook = new Workbook();

// 将源工作簿的第一张工作表复制到目标工作簿
newWorkbook.Worksheets[0].Copy(sourceWorkbook.Worksheets[0]);

// 保存 Excel 文件
newWorkbook.Save("new-worksheets.xlsx");

使用下面列出的资源探索 C# 电子表格处理 API:

C# PowerPoint PPT 分割

C# PowerPoint 拆分

为了分割 PowerPoint PPT 演示文稿,Aspose 提供了 Aspose.Slides for .NET - 一个强大的 C# API,用于生成、修改和转换 PowerPoint 演示文稿,包括 PPT、PPTX 、PPS、POT 和 ODP。 Aspose.Slides for .NET 是 C# 开发人员在各种应用程序中处理 PowerPoint 演示文稿的首选解决方案。

那么让我们看看如何使用 Aspose.Slides for .NET 在 C# 中分割 PowerPoint PPT。

  • 安装Aspose.Slides for .NET
  • 首先,创建Presentation 类的实例来加载PowerPoint 演示文稿。
  • 然后,循环访问Presentation.Slides 集合中的每个ISlide。
  • 在每次迭代中,执行以下步骤:
    • 创建Presentation类的实例。
    • 使用Presentation.Slides[0].Remove()方法删除默认幻灯片。
    • 使用Presentation.Slides.AddClone(ISlide) 方法将幻灯片添加到演示文稿。
    • 最后,使用Presentation.Save(String, SaveFormat)方法保存演示文稿。

以下代码示例展示了如何使用 C# 拆分 PowerPoint PPT:

// 加载 PowerPoint 演示文稿
using (Presentation pres = new Presentation("presentation.pptx"))
{
    // 循环播放幻灯片
    foreach(ISlide slide in pres.Slides)
    {
        // 创建一个新的空演示文稿
        using (Presentation newPres = new Presentation())
        {
            // 删除默认幻灯片
            newPres.Slides[0].Remove();

            // 将幻灯片添加到演示文稿
            newPres.Slides.AddClone(slide);
                       
            // 保存演示文稿
            newPres.Save(string.Format("Slide_{0}.pptx", slide.SlideNumber), SaveFormat.Pptx);
        }
    }
}

阅读完整的文章如何在C#中分割PPT演示文稿

以下是一些有用的资源,可用于探索有关 C# PowerPoint 处理 API 的更多信息。

获取免费许可证

获取您的免费许可证并享受文档分割,没有任何评估限制。

加起来

C# 中的文档拆分通常用于需要将大文档转换为较小文档的各种情况。由于页面/纸张/幻灯片数量较少的文档更易于管理和处理,因此文档被拆分为多个文件。在本文中,我们演示了如何在 C# 中拆分不同格式的文档。我们借助代码示例介绍了 PDF、Word、PowerPoint 和 Excel 文件的拆分。您可以轻松集成提供的 API 并在 C# 应用程序中执行文档拆分。

也可以看看