PDF sang XLS trong C# .NET

Việc chuyển đổi file PDF sang định dạng Excel trở nên cần thiết khi bạn cần xuất dữ liệu dạng bảng từ tài liệu PDF sang bảng tính. Là một lập trình viên, bạn thường lấy dữ liệu dạng bảng ở định dạng PDF và để xử lý dữ liệu đó, nó phải được chuyển đổi sang định dạng Excel. Vì vậy, chúng ta hãy xem cách thực hiện điều đó theo chương trình từ bên trong các ứng dụng .NET. Sau khi đọc bài viết này, bạn sẽ có thể chuyển đổi PDF sang Excel XLS hoặc XLSX trong C# .NET.

Bài viết này bao gồm các chuyển đổi PDF sang Excel sau đây.

Trình chuyển đổi C# .NET PDF sang Excel - Tải xuống miễn phí

Để chuyển đổi tệp PDF sang Excel XLS/XLS trong C#, chúng tôi sẽ sử dụng Aspose.PDF for .NET. API hỗ trợ tạo và thao tác với các tài liệu PDF cũng như chuyển đổi các tệp PDF sang các định dạng khác với độ trung thực cao. Bạn có thể tải xuống DLL của nó hoặc cài đặt nó từ NuGet bằng một trong các cách sau.

Trình chuyển đổi PDF sang Excel - Cài đặt qua Trình quản lý gói NuGet

  • Mở/tạo dự án trong Visual Studio.
  • Truy cập Trình quản lý gói NuGet và tìm kiếm Aspose.PDF.
  • Cài đặt API.

Cài đặt qua Bảng điều khiển quản lý gói

PM> Install-Package Aspose.PDF

Chuyển đổi PDF sang Excel XLS trong C#

Để chuyển đổi tài liệu PDF sang bảng tính XLS, bạn chỉ cần tải tệp PDF và lưu tệp đó với phần mở rộng “.xls”. Sau đây là các bước để thực hiện chuyển đổi này.

  • Tải tệp PDF bằng lớp Tài liệu.
  • Tạo một đối tượng của lớp ExcelSaveOptions.
  • Lưu tệp PDF dưới dạng Excel XLS bằng phương thức Document.Save(string, ExcelSaveOptions).

Mẫu mã sau đây cho biết cách chuyển đổi PDF sang Excel XLS trong C#.

// Tải tài liệu PDF
Document pdfDocument = new Document("sampletable.pdf");
ExcelSaveOptions options = new ExcelSaveOptions(); 
// Lưu tập tin đầu ra
pdfDocument.Save("Excel.xls", options);

Nhập tài liệu PDF

Excel XLS đã chuyển đổi

Chuyển đổi PDF sang XLSX trong C#

Theo mặc định, Aspose.PDF chuyển đổi tài liệu PDF sang định dạng XLS. Trong trường hợp bạn muốn lấy bảng tính Excel đã chuyển đổi ở định dạng XLSX, bạn có thể chỉ định nó bằng lớp ExcelSaveOptions.

Mẫu mã sau đây cho biết cách chuyển đổi tài liệu PDF sang Excel với định dạng XLSX bằng C#.

// Tải tài liệu PDF
Document pdfDocument = new Document("sampletable.pdf");
// Khởi tạo ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Đặt định dạng đầu ra
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Lưu tập tin đầu ra
pdfDocument.Save("Excel.xlsx", options);

C# Xuất PDF sang Excel - Cột đầu tiên trống

Bạn cũng có thể chèn một cột trống đầu tiên trong bảng tính Excel đã chuyển đổi. Điều này có thể được thực hiện bằng tùy chọn ExcelSaveOptions.InsertBlankColumnAtFirst.

  • Tải tệp PDF bằng lớp Tài liệu.
  • Tạo một đối tượng của lớp ExcelSaveOptions.
  • (Tùy chọn) Đặt định dạng Excel đầu ra thành XLSX bằng thuộc tính ExcelSaveOptions.Format.
  • Đặt thuộc tính ExcelSaveOptions.InsertBlankColumnAtFirst thành true.
  • Lưu tệp PDF ở định dạng Excel bằng phương thức Document.Save(string, ExcelSaveOptions).

Mẫu mã sau đây cho biết cách thêm cột đầu tiên trống trong chuyển đổi PDF sang Excel.

// Tải tài liệu PDF
Document pdfDocument = new Document("sampletable.pdf");
// Khởi tạo ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Đặt định dạng đầu ra
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Để chèn cột trống làm cột đầu tiên vào Bảng tính 
options.InsertBlankColumnAtFirst = true;
// Lưu tập tin đầu ra
pdfDocument.Save("Excel.xlsx", options);

Lưu PDF dưới dạng XLS trong C# - Số lượng Trang tính Tối thiểu

Theo mặc định, mọi trang trong tài liệu PDF đầu vào được chuyển đổi thành một trang tính riêng. Đối với các tài liệu PDF lớn có nhiều trang, bảng tính Excel được chuyển đổi cũng sẽ chứa một số trang tính. Trong trường hợp như vậy, bạn có thể tùy chỉnh chuyển đổi PDF sang Excel và giảm thiểu số lượng trang tính trong bảng tính được chuyển đổi. Sau đây là các bước để thực hiện tùy chỉnh này.

  • Tải tệp PDF bằng lớp Tài liệu.
  • Tạo một đối tượng của lớp ExcelSaveOptions.
  • (Tùy chọn) Đặt định dạng Excel đầu ra thành XLSX bằng thuộc tính ExcelSaveOptions.Format.
  • Đặt thuộc tính ExcelSaveOptions.MinimizeTheNumberOfWorksheets thành true.
  • Lưu tệp PDF dưới dạng XLS/XLSX bằng phương thức Document.Save(string, ExcelSaveOptions).

Mẫu mã sau đây cho biết cách giảm thiểu số lượng trang tính trong chuyển đổi PDF sang Excel trong C#.

// Tải tài liệu PDF
Document pdfDocument = new Document("sampletable.pdf");
// Khởi tạo ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Đặt định dạng đầu ra
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Giảm thiểu số lượng Worksheets
options.MinimizeTheNumberOfWorksheets = true;
// Lưu tập tin đầu ra
pdfDocument.Save("Excel.xlsx", options);

Thư viện chuyển đổi PDF sang Excel C# - Nhận giấy phép miễn phí

Bạn có thể [nhận giấy phép tạm thời miễn phí][17] để chuyển đổi tệp PDF sang định dạng Excel mà không bị giới hạn đánh giá.

Đọc thêm

Trong trường hợp bạn muốn khám phá các tính năng khác của Aspose.PDF, hãy truy cập tài liệu tại đây.

Sự kết luận

Trong bài viết này, bạn đã học cách chuyển đổi các tệp PDF sang định dạng Excel theo chương trình trong C#. Hơn nữa, bạn đã thấy cách tùy chỉnh chuyển đổi bằng các tùy chọn khác nhau. Bạn có thể dễ dàng tích hợp mẫu mã được cung cấp vào các ứng dụng .NET của mình.

Những bài viết liên quan

Tài liệu PDF sang Excel XLS/XLSX bằng JavaChuyển tài liệu Word sang PDF theo chương trình trong C# .NETTệp PDF thành văn bản trong Python
XLSX sang JSON trong JavaExcel sang JSON trong JavaDOCX sang JSON trong Java
DOC sang JSON trong JavaTừ chuyển thành JSON trong JavaTXT sang JSON trong Java
JSON sang PDF bằng PythonExcel sang JSON trong JavaTXT sang JSON trong Python
Chuyển tài liệu Word sang Markdown bằng C#Chuyển tài liệu Word sang Markdown bằng JavaChuyển tài liệu Word sang TIFF bằng Python
Chuyển Word sang HTML bằng PythonChuyển Word sang HTML bằng C#Chuyển Word sang HTML bằng Java
Chuyển Word thành Markdown trong Python