Tách tài liệu trong C#

Chia nhỏ tài liệu là một công việc cơ bản trong quản lý thông tin và xử lý dữ liệu. Nó liên quan đến việc phân chia chiến lược các văn bản hoặc tệp dài thành các phân đoạn nhỏ hơn, dễ quản lý hơn. Thông thường nhất, các tài liệu được chia theo từng trang hoặc một loạt các trang. Cho dù xử lý một khối lượng tài liệu nghiên cứu, báo cáo mở rộng hay bộ dữ liệu, quá trình chia tách tài liệu tạo điều kiện cho tổ chức hiệu quả. Bài viết này sẽ giới thiệu cho bạn bộ sưu tập cuối cùng các API để phân chia tài liệu theo chương trình trong C#. Do đó, bạn sẽ có thể chia tài liệu ở định dạng Word, PDF, Excel và PowerPoint.

API C# để phân chia tài liệu

Aspose là nhà cung cấp API linh hoạt và mạnh mẽ hàng đầu được thiết kế để đơn giản hóa quy trình phân tách tài liệu một cách hiệu quả và chính xác. Trong một thế giới mà việc quản lý và thao tác với các tệp lớn và phức tạp là một nhiệm vụ phức tạp, các API tiên tiến của Aspose cung cấp một giải pháp mạnh mẽ. Cho dù xử lý tài liệu văn bản, bảng tính hay bản trình bày toàn diện, API của Aspose hỗ trợ các nhà phát triển dễ dàng chia các tài liệu này thành các thành phần nhỏ hơn và dễ quản lý hơn. Vì vậy, chúng ta hãy xem API phân tách tài liệu của Aspose đã tối ưu hóa việc quản lý tài liệu trong các ngành và ứng dụng khác nhau.

Tách tài liệu PDF trong C#

Chia tách C# PDF

Định dạng Tài liệu Di động (PDF) là một định dạng phổ biến cung cấp một bộ chức năng phong phú và khả năng duy trì bố cục nhất quán trên các hệ thống khác nhau. PDF nổi lên như một lựa chọn ưa thích để chia sẻ và in tài liệu. Từ các tài liệu nhỏ đến các báo cáo lớn, PDF được chọn làm định dạng tài liệu chính. Để tách các tệp PDF trong C#, Aspose cung cấp Aspose.PDF for .NET.

Aspose.PDF for .NET đơn giản hóa quá trình chia tách PDF và cung cấp cho bạn một cách linh hoạt để chia nhỏ tài liệu PDF. Bạn có thể tùy chỉnh phương pháp theo yêu cầu của bạn. Dưới đây là các bước mà bạn có thể làm theo để tách PDF trong C#.

  • Cài đặt Aspose.PDF for .NET.
  • Tải tài liệu PDF bằng lớp Tài liệu.
  • Lặp qua bộ sưu tập Document.Pages để truy cập từng trang bằng lớp Trang.
  • Trong mỗi lần lặp lại, hãy tạo một Tài liệu mới, thêm trang hiện tại vào tài liệu và lưu dưới dạng tệp PDF bằng phương thức Document.Save(String).

Mẫu mã sau minh họa việc chia tài liệu PDF trong C#.

// mở tài liệu
Document pdfDocument = new Document("merged.pdf");

// Đối với bộ đếm trang
int pageCount = 1;

// Lặp qua tất cả các trang
foreach (Aspose.Pdf.Page pdfPage in pdfDocument.Pages)
{
  	// Tạo một tài liệu mới
	Document newDocument = new Document();
  
  	// Thêm trang vào tài liệu
	newDocument.Pages.Add(pdfPage);
  
  	// Lưu dưới dạng PDF 
	newDocument.Save("page_" + pageCount + "_out" + ".pdf");
	pageCount++;
}

Đọc toàn bộ bài viết về tách tài liệu PDF bằng C#.

Bắt đầu với API xử lý tài liệu C# PDF bằng cách sử dụng các tài nguyên được cung cấp bên dưới:

Tách tài liệu Word trong C#

Tách từ C#

Microsoft Word đã trở thành một công cụ được ưa chuộng và sử dụng rộng rãi để tạo nhiều loại tài liệu văn bản, bao gồm các báo cáo, hợp đồng, sơ yếu lý lịch, v.v. Các tệp này thường được lưu ở định dạng DOC/DOCX. Để chia tài liệu MS Word, Aspose cung cấp Aspose.Words for .NET.

Aspose.Words for .NET là một thư viện xử lý văn bản mạnh mẽ với nhiều tính năng để tạo và thao tác với các tài liệu Word. Với công cụ xử lý tài liệu mạnh mẽ, API cho phép bạn thực hiện việc chia nhỏ tài liệu từ một cách dễ dàng với độ chính xác cao. Vì vậy, hãy xem cách chia tài liệu Word trong C# bằng cách sử dụng Aspose.Words for .NET.

  • Cài đặt Aspose.Words for .NET.
  • Tải tài liệu Word bằng lớp Tài liệu.
  • Tạo một đối tượng của lớp DocumentPageSplitter và khởi tạo nó với đối tượng Document.
  • Lặp lại qua các trang của tài liệu.
  • Trích xuất từng trang thành một đối tượng Tài liệu mới bằng cách sử dụng phương thức DocumentPageSplitter.GetDocumentOfPage(int PageIndex).
  • Lưu từng tài liệu bằng phương thức Document.Save(String).

Mẫu mã C# bên dưới thể hiện việc chia nhỏ tài liệu Word.

// Mở một tài liệu Word
Document doc = new Document("Document.docx");

// Tạo và khởi tạo bộ chia trang tài liệu
DocumentPageSplitter splitter = new DocumentPageSplitter(doc);

// Lưu từng trang dưới dạng một tài liệu riêng biệt
for (int page = 1; page <= doc.PageCount; page++)
{
	Document pageDoc = splitter.GetDocumentOfPage(page);
	pageDoc.Save($"spliteed_{page}.docx");
}

Đọc toàn bộ bài viết về tách tài liệu Word bằng C#.

Bạn có thể bắt đầu với API tách tài liệu C# Word bằng cách sử dụng các tài nguyên được cung cấp bên dưới.

Tách bảng tính Excel trong C#

Tách bảng tính C#

MS Excel, một ứng dụng phổ biến khác của MS Office, cho phép bạn tổ chức và quản lý dữ liệu dạng bảng ở dạng trang tính và sổ làm việc. Ngoài ra, nó còn cung cấp nhiều tính năng khác nhau để xử lý dữ liệu, tạo biểu diễn trực quan, thực hiện các phép tính số, v.v. Để tách bảng tính trong C#, Aspose cung cấp Aspose.Cells for .NET.

Tương tự như các API đã đề cập ở trên, Aspose.Cells for .NET cũng giúp bạn tách các trang tính từ một sổ làm việc và lưu chúng dưới dạng các tệp riêng biệt khá đơn giản. Bạn chỉ cần truy cập trang tính mong muốn và chia trang tính đó thành một tài liệu bảng tính mới. Vì vậy, hãy thực hiện tách bảng tính Excel trong C#.

  • Cài đặt Aspose.Cells for .NET.
  • Tải tệp Excel bằng lớp Workbook.
  • Tạo một đối tượng Workbook mới.
  • Sao chép trang tính từ sổ làm việc nguồn sang sổ làm việc mới được tạo.
  • Lưu sổ làm việc mới bằng phương thức Workbook.Save().

Mẫu mã dưới đây trình bày cách tách bảng tính Excel trong C#.

// Tệp Excel mã nguồn mở
Workbook sourceWorkbook = new Workbook("source.xlsx");

// Mở tệp Excel đích
Workbook newWorkbook = new Workbook();

// Sao chép trang tính đầu tiên của sổ làm việc nguồn vào sổ làm việc đích
newWorkbook.Worksheets[0].Copy(sourceWorkbook.Worksheets[0]);

// Lưu tệp Excel
newWorkbook.Save("new-worksheets.xlsx");

Khám phá API xử lý bảng tính C# bằng các tài nguyên được liệt kê bên dưới:

Chia tách PPT C# PowerPoint

Chia tách C# PowerPoint

Để chia nhỏ bản trình bày PowerPoint PPT, Aspose cung cấp Aspose.Slides for .NET - API C# mạnh mẽ để tạo, sửa đổi và chuyển đổi bản trình bày PowerPoint bao gồm PPT, PPTX , PPS, POT và ODP. Aspose.Slides for .NET là một giải pháp dành cho các nhà phát triển C# để xử lý các bản trình bày PowerPoint trong phạm vi ứng dụng đa dạng của họ.

Vì vậy, hãy xem cách tách PowerPoint PPT trong C# bằng cách sử dụng Aspose.Slides for .NET.

  • Cài đặt Aspose.Slides for .NET.
  • Đầu tiên, tạo một thể hiện của lớp Bản trình bày để tải bản trình bày PowerPoint.
  • Sau đó, lặp qua từng ISlide trong bộ sưu tập Presentation.Slides.
  • Trong mỗi lần lặp lại, hãy thực hiện các bước sau:
    • Tạo một thể hiện của lớp Presentation.
    • Xóa trang chiếu mặc định bằng phương thức Presentation.Slides[0].Remove().
    • Thêm trang chiếu vào bản trình bày bằng phương pháp Presentation.Slides.AddClone(ISlide).
    • Cuối cùng, lưu bản trình bày bằng phương thức Presentation.Save(String, SaveFormat).

Mẫu mã sau đây cho thấy cách tách PowerPoint PPT trong C#:

// Tải bản trình bày PowerPoint
using (Presentation pres = new Presentation("presentation.pptx"))
{
    // Lặp qua các slide
    foreach(ISlide slide in pres.Slides)
    {
        // Tạo một bản trình bày trống mới
        using (Presentation newPres = new Presentation())
        {
            // Xóa trang trình bày mặc định
            newPres.Slides[0].Remove();

            // Thêm trang trình bày vào bản trình bày
            newPres.Slides.AddClone(slide);
                       
            // Lưu bản trình bày
            newPres.Save(string.Format("Slide_{0}.pptx", slide.SlideNumber), SaveFormat.Pptx);
        }
    }
}

Đọc toàn bộ bài viết về cách chia nhỏ bản trình bày PPT trong C#:

Dưới đây là một số tài nguyên hữu ích để khám phá thêm về API xử lý C# PowerPoint.

Nhận giấy phép miễn phí

Nhận giấy phép miễn phí của bạn và tận hưởng việc chia nhỏ tài liệu mà không có bất kỳ giới hạn đánh giá nào.

Tổng hợp

Chia nhỏ tài liệu trong C# thường được sử dụng trong nhiều trường hợp khi các tài liệu lớn được yêu cầu chuyển đổi thành các tài liệu nhỏ hơn. Do tài liệu có số lượng trang/tờ/slide ít hơn sẽ dễ quản lý và xử lý hơn nên tài liệu được chia thành nhiều tệp. Trong bài viết này, chúng tôi đã trình bày cách chia nhỏ các tài liệu có định dạng khác nhau trong C#. Chúng tôi đã đề cập đến việc chia nhỏ các tệp PDF, Word, PowerPoint và Excel với sự trợ giúp của các mẫu mã. Bạn có thể dễ dàng tích hợp các API được cung cấp và thực hiện chia nhỏ tài liệu trong các ứng dụng C# của mình.

Xem thêm