Extrahujte obrázky z PDF Python

Pokud hledáte přímou metodu pro extrahování obrázků z PDF pomocí Python, tento článek poskytuje cenné řešení. Pomocí několika jednoduchých kroků se můžete naučit, jak efektivně zpracovat soubor PDF a extrahovat jeho obrázky. Pojďme se tedy podívat, jak extrahovat obrázky ze souboru PDF v Python.

Knihovna Python pro extrahování obrázků ve formátu PDF

K extrahování obrázků z PDF použijeme Aspose.PDF for Python. Je to robustní knihovna PDF, která vám umožní snadno vytvářet a zpracovávat soubory PDF. Kromě toho vám umožňuje analyzovat PDF a extrahovat obrázky v několika řádcích kódu. Pomocí následujícího příkazu pip nainstalujte knihovnu ve své aplikaci.

> pip install aspose-pdf 

Jak extrahovat obrázky z PDF v Python

Níže jsou uvedeny kroky, které budeme dodržovat při extrahování obrázků ze souboru PDF.

  • Načtěte soubor PDF.
  • Procházejte stránky v PDF.
  • Extrahujte obrázky jeden po druhém.
  • Uložte extrahované obrázky.

Pojďme nyní tyto kroky převést do kódu Python a extrahovat obrázky z PDF.

Extrakce obrázků PDF v Python

Níže jsou uvedeny kroky k extrahování obrázků z PDF v Python.

  • Nejprve načtěte PDF pomocí třídy Document.
  • Procházejte stránky PDF pomocí kolekce document.pages.
  • Pro každou stránku otevřete každý XImage v kolekci resources.images.
  • Uložte každý obrázek na požadované místo pomocí metody XImage.save().

Následující ukázka kódu ukazuje, jak extrahovat obrázky z PDF v Python.

import aspose.pdf as ap
import aspose.pydrawing as drawing

# Načtěte PDF
document = ap.Document("document.pdf")

image_counter = 1
image_name = "image_{counter}.jpg"

# Projděte všechny stránky
for page in document.pages:

    # Procházejte obrázky na stránce
   for image in page.resources.images: 
        
        # Vytvořte objekt paměťového proudu pro uložení obrázku
        with open(image_name.format(counter=image_counter), "wb") as stream:
           
            # Uložte obrázek
            image.save(stream, drawing.imaging.ImageFormat.jpeg)
            image_counter = image_counter + 1

Online extraktor obrázků PDF

Poskytujeme také online PDF analyzátor, který je založen na Aspose.PDF for Python. Tento bezplatný nástroj můžete použít k analýze souborů PDF a extrahování obrázků.

Knihovna PDF v Python

Můžete získat bezplatnou dočasnou licenci a extrahovat obrázky ze souborů PDF bez jakýchkoli omezení.

Kromě toho můžete prozkoumat více o knihovně Python PDF pomocí dokumentace. Své dotazy můžete také zveřejňovat na našem fóru.

Závěr

V tomto článku jste se naučili, jak extrahovat obrázky z PDF v Python. Podrobný průvodce a ukázka kódu ukázaly, jak analyzovat PDF a extrahovat obrázky z každé stránky. Kromě toho jsme vám poskytli bezplatnou online aplikaci pro extrakci textu a obrázků ve formátu PDF. Tuto aplikaci můžete používat z jakéhokoli zařízení s připojením k internetu.

Viz také