Extrair imagens do PDF Python

Se você está procurando um método direto para extrair imagens de um PDF usando Python, este artigo fornece uma solução valiosa. Seguindo algumas etapas simples, você pode aprender como processar um arquivo PDF com eficiência e extrair suas imagens. Então vamos ver como extrair imagens de um arquivo PDF em Python.

Biblioteca Python para extrair imagens em PDF

Para extrair imagens de um PDF, usaremos Aspose.PDF for Python. É uma biblioteca de PDF robusta que permite criar e processar arquivos PDF sem esforço. Além disso, permite analisar o PDF e extrair imagens em poucas linhas de código. Use o seguinte comando pip para instalar a biblioteca em seu aplicativo.

> pip install aspose-pdf 

Como extrair imagens de um PDF em Python

A seguir estão as etapas que seguiremos para extrair imagens de um arquivo PDF.

  • Carregue o arquivo PDF.
  • Percorra as páginas no PDF.
  • Extraia as imagens uma a uma.
  • Salve as imagens extraídas.

Vamos agora transformar essas etapas em código Python e extrair imagens de um PDF.

Extração de imagem PDF em Python

A seguir estão as etapas para extrair imagens de um PDF em Python.

  • Primeiro, carregue o PDF usando a classe Document.
  • Percorra as páginas do PDF usando a coleção document.pages.
  • Para cada página, acesse cada XImage na coleção resources.images.
  • Salve cada imagem no local desejado usando o método XImage.save().

O exemplo de código a seguir mostra como extrair imagens de um PDF em Python.

import aspose.pdf as ap
import aspose.pydrawing as drawing

# Carregar o PDF
document = ap.Document("document.pdf")

image_counter = 1
image_name = "image_{counter}.jpg"

# Percorra todas as páginas
for page in document.pages:

    # Percorrer as imagens na página
   for image in page.resources.images: 
        
        # Crie um objeto de fluxo de memória para salvar a imagem
        with open(image_name.format(counter=image_counter), "wb") as stream:
           
            # Salve a imagem
            image.save(stream, drawing.imaging.ImageFormat.jpeg)
            image_counter = image_counter + 1

Extrator de imagens em PDF on-line

Também fornecemos um analisador de PDF online, que é baseado em Aspose.PDF para Python. Você pode usar esta ferramenta gratuita para analisar os arquivos PDF e extrair imagens.

Biblioteca PDF Python

Você pode obter uma licença temporária gratuita e extrair imagens de arquivos PDF sem quaisquer limitações.

Além disso, você pode explorar mais sobre a biblioteca Python PDF usando a documentação. Além disso, você pode postar suas dúvidas em nosso fórum.

Conclusão

Neste artigo, você aprendeu como extrair imagens de um PDF em Python. O guia passo a passo e o exemplo de código demonstraram como analisar um PDF e extrair imagens de cada página. Além disso, fornecemos a você um aplicativo online gratuito para extração de texto e imagem em PDF. Você pode usar este aplicativo de qualquer dispositivo com conexão à Internet.

Veja também