Estrai immagini da PDF Python

Se stai cercando un metodo semplice per estrarre immagini da un PDF utilizzando Python, questo articolo fornisce una soluzione preziosa. Seguendo alcuni semplici passaggi, puoi imparare come elaborare in modo efficiente un file PDF ed estrarne le immagini. Vediamo quindi come estrarre immagini da un file PDF in Python.

Libreria Python per estrarre immagini in PDF

Per estrarre immagini da un PDF, useremo Aspose.PDF for Python. È una solida libreria PDF che ti consente di creare ed elaborare file PDF senza sforzo. Inoltre, ti consente di analizzare il PDF ed estrarre le immagini in poche righe di codice. Utilizza il seguente comando pip per installare la libreria nella tua applicazione.

> pip install aspose-pdf 

Come estrarre immagini da un PDF in Python

Di seguito sono riportati i passaggi che seguiremo per estrarre le immagini da un file PDF.

  • Carica il file PDF.
  • Scorrere le pagine del PDF.
  • Estrai le immagini una per una.
  • Salva le immagini estratte.

Trasformiamo ora questi passaggi in codice Python ed estraiamo le immagini da un PDF.

Estrazione di immagini PDF in Python

Di seguito sono riportati i passaggi per estrarre le immagini da un PDF in Python.

  • Innanzitutto, carica il PDF utilizzando la classe Document.
  • Scorrere le pagine del PDF utilizzando la raccolta document.pages.
  • Per ogni pagina, accedi a ogni XImage nella raccolta resources.images.
  • Salva ogni immagine nella posizione desiderata utilizzando il metodo XImage.save().

L’esempio di codice seguente mostra come estrarre immagini da un PDF in Python.

import aspose.pdf as ap
import aspose.pydrawing as drawing

# Carica il PDF
document = ap.Document("document.pdf")

image_counter = 1
image_name = "image_{counter}.jpg"

# Passa attraverso tutte le pagine
for page in document.pages:

    # Passa attraverso le immagini sulla pagina
   for image in page.resources.images: 
        
        # Crea un oggetto flusso di memoria per salvare l'immagine
        with open(image_name.format(counter=image_counter), "wb") as stream:
           
            # Salva l'immagine
            image.save(stream, drawing.imaging.ImageFormat.jpeg)
            image_counter = image_counter + 1

Estrattore di immagini PDF online

Forniamo anche un parser PDF online, basato su Aspose.PDF for Python. Puoi utilizzare questo strumento gratuito per analizzare i file PDF ed estrarre le immagini.

Libreria PDF Python

Puoi ottenere una licenza temporanea gratuita ed estrarre immagini da file PDF senza alcuna limitazione.

Inoltre, puoi esplorare di più sulla libreria Python PDF utilizzando la documentazione. Inoltre, puoi pubblicare le tue domande sul nostro forum.

Conclusione

In questo articolo, hai imparato come estrarre immagini da un PDF in Python. La guida dettagliata e l’esempio di codice hanno dimostrato come analizzare un PDF ed estrarre le immagini da ogni pagina. Inoltre, ti abbiamo fornito un’app online gratuita per l’estrazione di testo e immagini PDF. Puoi utilizzare questa app da qualsiasi dispositivo dotato di connessione Internet.

Guarda anche