Trích xuất trang từ tài liệu Word trong C# | Trích xuất trang Word

Trích xuất các trang Word từ các tệp DOC hoặc DOCX có thể hữu ích trong nhiều trường hợp. Bạn có thể muốn chia sẻ chỉ một phần, giữ một bản tóm tắt, hoặc tách một tài liệu dài. Trong bài viết này, chúng tôi sẽ chỉ cho bạn cách trích xuất một trang đơn hoặc một phạm vi các trang từ một tài liệu Word bằng cách sử dụng C#.

Bài viết này đề cập đến các chủ đề sau:

.NET SDK để Trích xuất Trang Word

Chúng tôi sẽ sử dụng Aspose.Words for .NET để trích xuất các trang Word một cách lập trình trong C#. Đây là một thư viện mạnh mẽ để làm việc với các tài liệu Word trong các ứng dụng .NET. Nó cho phép các nhà phát triển tạo, chỉnh sửa, chuyển đổi và trích xuất nội dung từ các tệp Word một cách lập trình.

Cách cài đặt Aspose.Words for .NET

  1. Download hoặc cài đặt gói NuGet:
PM> Install-Package Aspose.Words
  1. Thêm các không gian tên cần thiết vào mã của bạn, chẳng hạn như:
using Aspose.Words;

Đó là tất cả, bạn đã sẵn sàng để làm việc với các tệp Word.

Trích xuất một trang từ tài liệu Word

Để trích xuất một trang cụ thể từ tài liệu Word, vui lòng làm theo các bước dưới đây:

  1. Tải tài liệu Word bằng cách sử dụng lớp Document.
  2. Lặp qua từng trang bằng một vòng lặp for đơn giản.
  3. Sử dụng phương thức ExtractPages() để lấy ra từng trang một.
  4. Lưu mỗi trang dưới dạng một tệp .docx riêng biệt bằng cách sử dụng phương thức Save().

Ví dụ mã sau đây cho thấy cách trích xuất một trang duy nhất từ một tài liệu Word trong C#:

using Aspose.Words;

// Tải lên một tài liệu
Document doc = new Document("sample-multi-page.docx");

// Trích xuất từng trang một
for (int page = 0; page < doc.PageCount; page++)
{
    // Lưu mỗi trang dưới dạng tài liệu riêng biệt.
    Document extractedPage = doc.ExtractPages(page, 1);
    extractedPage.Save($"split_by_page_{page + 1}.docx");
}

Mã này tải tệp, trích xuất các trang một cách lần lượt và lưu chúng dưới dạng các tài liệu Word mới.

Trích xuất một Trang từ Tài liệu Word bằng C#

Trích xuất một trang từ tài liệu Word trong C#

Trích Xuất Một Phạm Vi Trang Từ Tài Liệu Word

Bạn cũng có thể trích xuất nhiều trang cùng một lúc bằng cách làm theo các bước dưới đây:

  1. Tải tài liệu bằng cách sử dụng lớp Document.
  2. Trích xuất một phạm vi trang bằng cách sử dụng phương thức ExtractPages().
  3. Lưu các trang đã trích xuất dưới dạng tệp .docx mới.
using Aspose.Words;

// Load a document
Document doc = new Document("sample-multi-page.docx");

// Rút ra khoảng trang
Document extractedPages = doc.ExtractPages(3, 2);

// Lưu trang dưới dạng tài liệu riêng biệt
extractedPages.Save("split_by_page_range.docx");

Điều này tạo ra một tài liệu mới chỉ chứa các trang đã chọn.

Trích xuất một khoảng trang từ tệp Word trong C#

Trích xuất một khoảng trang từ một tệp Word bằng C#

Trích xuất trang từ Word Online

Bạn cũng có thể thử trình tách Word trực tuyến miễn phí của chúng tôi để trích xuất các trang Word. Chỉ cần tải lên tệp của bạn, chọn các trang và tải xuống kết quả.

Image

Khám Phá Tài Nguyên Học Tập Miễn Phí

Dưới đây là một số liên kết hữu ích để tìm hiểu thêm:

Kết luận

Trong bài viết này, bạn đã học cách trích xuất các trang từ tài liệu Word bằng cách sử dụng C#. Chúng tôi đã sử dụng Aspose.Words for .NET để trích xuất nhanh chóng và dễ dàng các trang đơn và nhiều trang. Cách tiếp cận này lý tưởng để tạo ra các tóm tắt, xuất các phần, hoặc chia nhỏ các tệp lớn.

Có câu hỏi? Hãy thoải mái đặt câu hỏi trên support forum.

Xem thêm