
Saat mem-parsing file PDF, Anda mungkin perlu mengekstrak gambar beserta teks dari dokumen. Untuk melakukan operasi ini secara terprogram, artikel ini membahas cara mengekstrak gambar dari dokumen PDF di Java. Panduan langkah demi langkah bersama dengan referensi API dan contoh kode menunjukkan prosedur ekstraksi gambar yang lengkap.
Java API untuk Mengekstrak Gambar dari PDF - Unduhan Gratis
Untuk mengekstrak gambar dari PDF, kami akan menggunakan Anggap.PDF untuk Java. Ini adalah API manipulasi PDF yang kuat yang menyediakan berbagai fitur untuk membuat dan memproses file PDF. Anda dapat mengunduh API atau menginstalnya menggunakan konfigurasi Maven berikut.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>21.5</version>
</dependency>
Mengekstrak Gambar dari PDF di Jawa
Berikut langkah-langkah mengekstrak gambar dari dokumen PDF menggunakan Java.
- Muat dokumen PDF menggunakan kelas Document.
- Iterasi melalui kumpulan halaman dokumen yang dikembalikan oleh metode Document.getPages().
- Untuk setiap Halaman, ulangi koleksi XImage yang dimilikinya menggunakan metode Page.getResources().getImages().
- Buat objek FileOutputStream untuk menyimpan setiap gambar.
Contoh kode berikut menunjukkan cara mengekstrak gambar dari dokumen PDF.
// Muat dokumen PDF
Document pdfDocument = new Document("ImagetoPDF.pdf");
// Ulangi halaman
for (Page page : pdfDocument.getPages()) {
int imageCounter = 1;
// Ulangi melalui gambar
for (XImage xImage : page.getResources().getImages()) {
try {
// Buat aliran file
java.io.FileOutputStream outputImage = new java.io.FileOutputStream(
page.getNumber() + "_" + imageCounter + ".jpg");
// Simpan gambar keluaran
xImage.save(outputImage);
// Tutup alirannya
outputImage.close();
} catch (java.io.FileNotFoundException e) {
// TODO: menangani pengecualian
e.printStackTrace();
} catch (java.io.IOException e) {
// TODO: menangani pengecualian
e.printStackTrace();
}
imageCounter++;
}
// Setel ulang penghitung
imageCounter=1;
}
Java PDF Image Extractor - Dapatkan Lisensi Gratis
Anda dapat menggunakan Aspose.PDF for Java tanpa batasan evaluasi menggunakan lisensi sementara.
Kesimpulan
Dalam berbagai kasus, gambar harus diekstraksi dari dokumen PDF. Untuk mencapainya, dalam artikel ini, Anda telah mempelajari cara mengekstrak gambar dari file PDF di Java. Anda dapat mempelajari lebih lanjut tentang Java PDF API menggunakan dokumentasi. Selain itu, Anda dapat memposting pertanyaan Anda di forum kami.