Trích xuất hình ảnh từ PDF trong Java

Trong khi phân tích cú pháp tệp PDF, bạn có thể cần trích xuất hình ảnh cùng với văn bản từ tài liệu. Để thực hiện thao tác này theo chương trình, bài viết này trình bày cách trích xuất hình ảnh từ tài liệu PDF bằng Java. Hướng dẫn từng bước cùng với tài liệu tham khảo API và mẫu mã chứng minh quy trình trích xuất hình ảnh hoàn chỉnh.

Java API để trích xuất hình ảnh từ PDF - Tải xuống miễn phí

Để trích xuất hình ảnh từ PDF, chúng tôi sẽ sử dụng Aspose.PDF for Java. Đây là một API thao tác PDF mạnh mẽ cung cấp một loạt các tính năng để tạo và xử lý các tệp PDF. Bạn có thể tải xuống API hoặc cài đặt nó bằng cách sử dụng cấu hình Maven sau.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>21.5</version>
</dependency>

Trích xuất hình ảnh từ PDF trong Java

Sau đây là các bước để trích xuất hình ảnh từ tài liệu PDF bằng Java.

Mẫu mã sau đây cho thấy cách trích xuất hình ảnh từ tài liệu PDF.

// Tải tài liệu PDF
Document pdfDocument = new Document("ImagetoPDF.pdf");

// Lặp lại các trang
for (Page page : pdfDocument.getPages()) {

	int imageCounter = 1;

	// Lặp qua các hình ảnh
	for (XImage xImage : page.getResources().getImages()) {
		try {
			
			// Tạo luồng tệp 
			java.io.FileOutputStream outputImage = new java.io.FileOutputStream(
					page.getNumber() + "_" + imageCounter + ".jpg");
			
			// Lưu hình ảnh đầu ra
			xImage.save(outputImage);
			
			// Đóng luồng
			outputImage.close();
		} catch (java.io.FileNotFoundException e) {
			// TODO: xử lý ngoại lệ
			e.printStackTrace();
		} catch (java.io.IOException e) {
			// TODO: xử lý ngoại lệ
			e.printStackTrace();
		}
		
		imageCounter++;
	}
	
	// Lập lại truy cập
	imageCounter=1;
}

Java PDF Image Extractor - Nhận Giấy phép Miễn phí

Bạn có thể sử dụng Aspose.PDF for Java mà không bị giới hạn đánh giá bằng cách sử dụng giấy phép tạm thời.

Sự kết luận

Trong nhiều trường hợp, hình ảnh được yêu cầu trích xuất từ tài liệu PDF. Để đạt được điều này, trong bài viết này, bạn đã học cách trích xuất hình ảnh từ tệp PDF trong Java. Bạn có thể khám phá thêm về Java PDF API bằng cách sử dụng tài liệu. Ngoài ra, bạn có thể đăng các câu hỏi của mình trên diễn đàn của chúng tôi.

Xem thêm