Trong khi phân tích cú pháp tệp PDF, bạn có thể cần trích xuất hình ảnh cùng với văn bản từ tài liệu. Để thực hiện thao tác này theo chương trình, bài viết này trình bày cách trích xuất hình ảnh từ tài liệu PDF bằng Java. Hướng dẫn từng bước cùng với tài liệu tham khảo API và mẫu mã chứng minh quy trình trích xuất hình ảnh hoàn chỉnh.
Java API để trích xuất hình ảnh từ PDF - Tải xuống miễn phí
Để trích xuất hình ảnh từ PDF, chúng tôi sẽ sử dụng Aspose.PDF for Java. Đây là một API thao tác PDF mạnh mẽ cung cấp một loạt các tính năng để tạo và xử lý các tệp PDF. Bạn có thể tải xuống API hoặc cài đặt nó bằng cách sử dụng cấu hình Maven sau.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>21.5</version>
</dependency>
Trích xuất hình ảnh từ PDF trong Java
Sau đây là các bước để trích xuất hình ảnh từ tài liệu PDF bằng Java.
- Tải tài liệu PDF bằng lớp Tài liệu.
- Lặp lại thông qua tập hợp trang của tài liệu được trả về bởi phương thức Document.getPages().
- Đối với mỗi Trang, lặp qua tập hợp XImage mà nó có bằng cách sử dụng phương thức Page.getResources(). GetImages().
- Tạo một đối tượng FileOutputStream để lưu từng ảnh.
Mẫu mã sau đây cho thấy cách trích xuất hình ảnh từ tài liệu PDF.
// Tải tài liệu PDF
Document pdfDocument = new Document("ImagetoPDF.pdf");
// Lặp lại các trang
for (Page page : pdfDocument.getPages()) {
int imageCounter = 1;
// Lặp qua các hình ảnh
for (XImage xImage : page.getResources().getImages()) {
try {
// Tạo luồng tệp
java.io.FileOutputStream outputImage = new java.io.FileOutputStream(
page.getNumber() + "_" + imageCounter + ".jpg");
// Lưu hình ảnh đầu ra
xImage.save(outputImage);
// Đóng luồng
outputImage.close();
} catch (java.io.FileNotFoundException e) {
// TODO: xử lý ngoại lệ
e.printStackTrace();
} catch (java.io.IOException e) {
// TODO: xử lý ngoại lệ
e.printStackTrace();
}
imageCounter++;
}
// Lập lại truy cập
imageCounter=1;
}
Java PDF Image Extractor - Nhận Giấy phép Miễn phí
Bạn có thể sử dụng Aspose.PDF for Java mà không bị giới hạn đánh giá bằng cách sử dụng giấy phép tạm thời.
Sự kết luận
Trong nhiều trường hợp, hình ảnh được yêu cầu trích xuất từ tài liệu PDF. Để đạt được điều này, trong bài viết này, bạn đã học cách trích xuất hình ảnh từ tệp PDF trong Java. Bạn có thể khám phá thêm về Java PDF API bằng cách sử dụng tài liệu. Ngoài ra, bạn có thể đăng các câu hỏi của mình trên diễn đàn của chúng tôi.