Extraire des images d'un PDF Python

Si vous recherchez une méthode simple pour extraire des images d’un PDF à l’aide de Python, cet article fournit une solution précieuse. En suivant quelques étapes simples, vous pouvez apprendre à traiter efficacement un fichier PDF et à extraire ses images. Voyons donc comment extraire des images d’un fichier PDF en Python.

Bibliothèque Python pour extraire des images en PDF

Pour extraire des images d’un PDF, nous utiliserons Aspose.PDF for Python. Il s’agit d’une bibliothèque PDF robuste qui vous permet de créer et de traiter des fichiers PDF sans effort. De plus, il vous permet d’analyser le PDF et d’extraire des images en quelques lignes de code. Utilisez la commande pip suivante pour installer la bibliothèque dans votre application.

> pip install aspose-pdf 

Comment extraire des images d’un PDF en Python

Voici les étapes que nous suivrons pour extraire des images d’un fichier PDF.

  • Chargez le fichier PDF.
  • Parcourez les pages du PDF.
  • Extrayez les images une par une.
  • Enregistrez les images extraites.

Transformons maintenant ces étapes en code Python et extrayons les images d’un PDF.

Extraction d’images PDF en Python

Voici les étapes pour extraire des images d’un PDF en Python.

  • Tout d’abord, chargez le PDF à l’aide de la classe Document.
  • Parcourez les pages du PDF à l’aide de la collection document.pages.
  • Pour chaque page, accédez à chaque XImage dans la collection resources.images.
  • Enregistrez chaque image à l’emplacement souhaité à l’aide de la méthode XImage.save().

L’exemple de code suivant montre comment extraire des images d’un PDF en Python.

import aspose.pdf as ap
import aspose.pydrawing as drawing

# Charger le PDF
document = ap.Document("document.pdf")

image_counter = 1
image_name = "image_{counter}.jpg"

# Boucle sur toutes les pages
for page in document.pages:

    # Boucle à travers les images sur la page
   for image in page.resources.images: 
        
        # Créer un objet de flux de mémoire pour enregistrer l'image
        with open(image_name.format(counter=image_counter), "wb") as stream:
           
            # Enregistrer l'image
            image.save(stream, drawing.imaging.ImageFormat.jpeg)
            image_counter = image_counter + 1

Extracteur d’images PDF en ligne

Nous fournissons également un analyseur PDF en ligne, basé sur Aspose.PDF for Python. Vous pouvez utiliser cet outil gratuit pour analyser les fichiers PDF et extraire des images.

Bibliothèque PDF Python

Vous pouvez obtenir une licence temporaire gratuite et extraire des images de fichiers PDF sans aucune limitation.

De plus, vous pouvez en savoir plus sur la bibliothèque Python PDF à l’aide de la documentation. Vous pouvez également poster vos questions sur notre forum.

Conclusion

Dans cet article, vous avez appris à extraire des images d’un PDF en Python. Le guide étape par étape et l’exemple de code ont montré comment analyser un PDF et extraire des images de chaque page. De plus, nous vous avons fourni une application en ligne gratuite pour l’extraction de texte et d’image PDF. Vous pouvez utiliser cette application à partir de n’importe quel appareil disposant d’une connexion Internet.

Voir également