Có thể có nhiều tình huống khác nhau khi bạn cần xuất dữ liệu trong bảng từ sổ làm việc PDF sang Excel. PDF sang Excel cho phép bạn chỉnh sửa dữ liệu, áp dụng công thức, vẽ biểu đồ và thực hiện các thao tác khác được bảng tính hỗ trợ. Trong bài viết này, tôi sẽ chỉ cho bạn cách tự động chuyển đổi PDF sang Excel và chuyển đổi sổ làm việc PDF sang XLS sang XLSX theo chương trình bằng cách sử dụng Java. Đối với điều này, chúng tôi sẽ tận dụng các khả năng của Aspose.PDF for Java API.
- API chuyển đổi PDF sang Excel - Cài đặt
- Chuyển đổi PDF sang XLS bằng Java
- Chuyển đổi PDF sang XLSX bằng Java
- PDF sang Excel - Giảm thiểu số lượng trang tính
Java PDF to Excel Converter - Cài đặt
Aspose.PDF for Java có sẵn để tải xuống dưới dạng tệp JAR. Ngoài ra, bạn có thể cài đặt nó trong các ứng dụng dựa trên Maven của mình bằng các cấu hình sau.
Kho:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
phụ thuộc:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>20.5</version>
<classifier>jdk17</classifier>
</dependency>
Chuyển đổi PDF sang Excel XLS bằng Java
Để chuyển đổi PDF sang Excel XLS, bạn chỉ cần tải tài liệu PDF và lưu nó với phần mở rộng .xls. Sau đây là các bước để thực hiện chuyển đổi này.
- Tải tệp PDF bằng lớp Document.
- Lưu tệp PDF dưới dạng Excel XLS bằng phương pháp Document.save(String outputFileName, int format).
Mẫu mã sau đây cho biết cách chuyển đổi PDF sang Excel XLS bằng Java.
// Tải tệp PDF nguồn
Document doc = new Document("sampletable.pdf");
// Chuyển đổi PDF sang XLS
doc.save("workbook.xls", SaveFormat.Excel);
Nhập tài liệu PDF
Xuất bảng tính Excel
Chuyển đổi PDF sang Excel XLSX bằng Java
Để chuyển đổi PDF sang bảng tính XLSX, bạn cần xác định định dạng Excel đầu ra bằng lớp ExcelSaveOptions. Sau đây là các bước để thực hiện chuyển đổi PDF sang XLSX bằng Aspose.PDF for Java.
- Tải tài liệu PDF đầu vào bằng lớp Document.
- Tạo một thể hiện của lớp ExcelSaveOptions.
- Đặt định dạng đầu ra bằng phương pháp ExcelSaveOptions.setFormat(ExcelSaveOptions.ExcelFormat.XLSX).
- Chuyển đổi PDF sang Excel bằng phương pháp Document.save(String outputFileName, SaveOptions options).
Mẫu mã sau đây cho biết cách chuyển đổi PDF sang XLSX bằng Java.
// Tải tệp PDF nguồn
Document doc = new Document("sampletable.pdf");
// Đặt tùy chọn Excel
ExcelSaveOptions options = new ExcelSaveOptions();
// Đặt định dạng đầu ra
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// Chuyển đổi PDF sang XLSX
doc.save("workbook.xlsx", options);
Giảm thiểu số lượng trang tính trong PDF sang Excel
Theo mặc định, Aspose.PDF chuyển đổi từng trang trong tài liệu PDF thành một trang tính riêng. Tuy nhiên, bạn có thể tùy chỉnh API để giảm thiểu số lượng trang tính trong trường hợp tài liệu PDF lớn. Sau đây là các bước để thực hiện thao tác này.
- Sử dụng lớp Document để tải tài liệu PDF đầu vào.
- Tạo một thể hiện của lớp ExcelSaveOptions.
- Đặt tùy chọn ExcelSaveOptions.setMinimizeTheNumberOfWorksheets(true).
- Lưu PDF dưới dạng XLSX.
Mẫu mã sau đây cho biết cách chuyển đổi PDF sang XLSX với số lượng trang tính tối thiểu bằng Java.
// Tải tệp PDF nguồn
Document doc = new Document("sampletable.pdf");
// Đặt tùy chọn Excel
ExcelSaveOptions options = new ExcelSaveOptions();
// Đặt định dạng đầu ra
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// Đặt tùy chọn thu nhỏ
options.setMinimizeTheNumberOfWorksheets(true);
// Chuyển đổi PDF sang Excel XLSX
doc.save("workbook.xlsx", options);
Sự kết luận
Trong bài viết này, bạn đã biết cách chuyển đổi tệp PDF sang tệp Excel XLS hoặc XLSX bằng Java. Hơn nữa, tính năng giảm thiểu số lượng trang tính trong PDF sang Excel cũng được thảo luận với sự trợ giúp của mẫu mã. Bạn có thể khám phá thêm về Aspose.PDF for Java bằng cách sử dụng tài liệu.