Extraire des images d'un PDF en Java

Lors de l’analyse des fichiers PDF, vous devrez peut-être extraire des images avec du texte des documents. Afin d’effectuer cette opération par programmation, cet article explique comment extraire des images de documents PDF en Java. Le guide étape par étape ainsi que les références de l’API et l’exemple de code illustrent la procédure complète d’extraction d’image.

API Java pour l’extraction d’images en PDF
Extraire des images d’un PDF en Java

API Java pour extraire des images d’un PDF - Téléchargement gratuit

Afin d’extraire des images d’un PDF, nous utiliserons Aspose.PDF for Java. Il s’agit d’une puissante API de manipulation de PDF qui fournit un large éventail de fonctionnalités pour créer et traiter des fichiers PDF. Vous pouvez soit télécharger l’API ou l’installer à l’aide de la configuration Maven suivante.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>21.5</version>
</dependency>

Extraire des images d’un PDF en Java

Voici les étapes pour extraire des images d’un document PDF à l’aide de Java.

Chargez le document PDF à l’aide de la classe Document.
Parcourez la collection de pages du document renvoyé par la méthode Document.getPages().
Pour chaque Page, parcourez la collection de XImage qu’elle possède en utilisant la méthode Page.getResources().getImages().
Créez un objet de FileOutputStream pour enregistrer chaque image.

L’exemple de code suivant montre comment extraire des images d’un document PDF.

// Charger le document PDF
Document pdfDocument = new Document("ImagetoPDF.pdf");

// Parcourir les pages en boucle
for (Page page : pdfDocument.getPages()) {

	int imageCounter = 1;

	// Boucle à travers les images
	for (XImage xImage : page.getResources().getImages()) {
		try {
			
			// Créer un flux de fichiers 
			java.io.FileOutputStream outputImage = new java.io.FileOutputStream(
					page.getNumber() + "_" + imageCounter + ".jpg");
			
			// Enregistrer l'image de sortie
			xImage.save(outputImage);
			
			// Fermer le flux
			outputImage.close();
		} catch (java.io.FileNotFoundException e) {
			// TODO : gérer l'exception
			e.printStackTrace();
		} catch (java.io.IOException e) {
			// TODO : gérer l'exception
			e.printStackTrace();
		}
		
		imageCounter++;
	}
	
	// Réinitialiser le compteur
	imageCounter=1;
}

Extracteur d’images Java PDF - Obtenez une licence gratuite

Vous pouvez utiliser Aspose.PDF for Java sans limitation d’évaluation à l’aide d’une licence temporaire.

Conclusion

Dans divers cas, les images doivent être extraites des documents PDF. Pour y parvenir, dans cet article, vous avez appris à extraire des images de fichiers PDF en Java. Vous pouvez en savoir plus sur l’API Java PDF à l’aide de la documentation. Vous pouvez également poster vos questions sur notre forum.

API Java pour extraire des images d’un PDF - Téléchargement gratuit#

Extraire des images d’un PDF en Java#

Extracteur d’images Java PDF - Obtenez une licence gratuite#

Conclusion#

Voir également#

API Java pour extraire des images d’un PDF - Téléchargement gratuit

Extraire des images d’un PDF en Java

Extracteur d’images Java PDF - Obtenez une licence gratuite

Conclusion

Voir également