Durante l’analisi dei file PDF, potrebbe essere necessario estrarre immagini e testo dai documenti. Per eseguire questa operazione a livello di codice, questo articolo illustra come estrarre immagini da documenti PDF in Java. La guida passo passo insieme ai riferimenti API e all’esempio di codice illustrano la procedura di estrazione dell’immagine completa.
API Java per estrarre immagini da PDF - Download gratuito
Per estrarre immagini dal PDF, utilizzeremo Aspose.PDF for Java. È una potente API di manipolazione PDF che fornisce un’ampia gamma di funzionalità per creare ed elaborare file PDF. Puoi scaricare l’API o installarla utilizzando la seguente configurazione Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>21.5</version>
</dependency>
Estrazione di immagini da un PDF in Java
Di seguito sono riportati i passaggi per estrarre immagini da un documento PDF utilizzando Java.
- Carica il documento PDF utilizzando la classe Document.
- Scorri la raccolta di pagine del documento restituito dal metodo Document.getPages().
- Per ogni Pagina, scorrere la raccolta di XImage che ha utilizzando il metodo Page.getResources().getImages().
- Crea un oggetto di FileOutputStream per salvare ogni immagine.
L’esempio di codice seguente mostra come estrarre immagini da un documento PDF.
// Carica documento PDF
Document pdfDocument = new Document("ImagetoPDF.pdf");
// Scorri le pagine
for (Page page : pdfDocument.getPages()) {
int imageCounter = 1;
// Scorri le immagini
for (XImage xImage : page.getResources().getImages()) {
try {
// Crea flusso di file
java.io.FileOutputStream outputImage = new java.io.FileOutputStream(
page.getNumber() + "_" + imageCounter + ".jpg");
// Salva immagine di output
xImage.save(outputImage);
// Chiudi il flusso
outputImage.close();
} catch (java.io.FileNotFoundException e) {
// TODO: gestire l'eccezione
e.printStackTrace();
} catch (java.io.IOException e) {
// TODO: gestire l'eccezione
e.printStackTrace();
}
imageCounter++;
}
// Reimposta contatore
imageCounter=1;
}
Estrattore di immagini PDF Java - Ottieni una licenza gratuita
È possibile utilizzare Aspose.PDF per Java senza limitazioni di valutazione utilizzando una licenza temporanea.
Conclusione
In vari casi, le immagini devono essere estratte dai documenti PDF. Per raggiungere questo obiettivo, in questo articolo, hai imparato come estrarre immagini da file PDF in Java. Puoi esplorare di più sull’API Java PDF utilizzando la documentazione. Inoltre, puoi pubblicare le tue domande sul nostro forum.