
Lors de l’analyse des fichiers PDF, vous devrez peut-être extraire des images avec du texte des documents. Afin d’effectuer cette opération par programmation, cet article explique comment extraire des images de documents PDF en Java. Le guide étape par étape ainsi que les références de l’API et l’exemple de code illustrent la procédure complète d’extraction d’image.
API Java pour extraire des images d’un PDF - Téléchargement gratuit
Afin d’extraire des images d’un PDF, nous utiliserons Aspose.PDF for Java. Il s’agit d’une puissante API de manipulation de PDF qui fournit un large éventail de fonctionnalités pour créer et traiter des fichiers PDF. Vous pouvez soit télécharger l’API ou l’installer à l’aide de la configuration Maven suivante.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>21.5</version>
</dependency>
Extraire des images d’un PDF en Java
Voici les étapes pour extraire des images d’un document PDF à l’aide de Java.
- Chargez le document PDF à l’aide de la classe Document.
- Parcourez la collection de pages du document renvoyé par la méthode Document.getPages().
- Pour chaque Page, parcourez la collection de XImage qu’elle possède en utilisant la méthode Page.getResources().getImages().
- Créez un objet de FileOutputStream pour enregistrer chaque image.
L’exemple de code suivant montre comment extraire des images d’un document PDF.
// Charger le document PDF
Document pdfDocument = new Document("ImagetoPDF.pdf");
// Parcourir les pages en boucle
for (Page page : pdfDocument.getPages()) {
int imageCounter = 1;
// Boucle à travers les images
for (XImage xImage : page.getResources().getImages()) {
try {
// Créer un flux de fichiers
java.io.FileOutputStream outputImage = new java.io.FileOutputStream(
page.getNumber() + "_" + imageCounter + ".jpg");
// Enregistrer l'image de sortie
xImage.save(outputImage);
// Fermer le flux
outputImage.close();
} catch (java.io.FileNotFoundException e) {
// TODO : gérer l'exception
e.printStackTrace();
} catch (java.io.IOException e) {
// TODO : gérer l'exception
e.printStackTrace();
}
imageCounter++;
}
// Réinitialiser le compteur
imageCounter=1;
}
Extracteur d’images Java PDF - Obtenez une licence gratuite
Vous pouvez utiliser Aspose.PDF for Java sans limitation d’évaluation à l’aide d’une licence temporaire.
Conclusion
Dans divers cas, les images doivent être extraites des documents PDF. Pour y parvenir, dans cet article, vous avez appris à extraire des images de fichiers PDF en Java. Vous pouvez en savoir plus sur l’API Java PDF à l’aide de la documentation. Vous pouvez également poster vos questions sur notre forum.