Dividir um arquivo PDF em vários arquivos usando Python

Na era digital de hoje, os arquivos PDF se tornaram uma parte essencial de nossas vidas. No entanto, às vezes podemos precisar dividir um arquivo PDF grande em arquivos menores por vários motivos, como enviar páginas específicas para alguém ou carregá-las em um site. Uma situação semelhante pode ocorrer ao processar arquivos PDF em Python. Portanto, neste artigo, veremos como dividir um arquivo PDF em Python. Abordaremos como dividir PDFs por cada página ou uma coleção de páginas.

Biblioteca Python para dividir PDF

Para dividir arquivos PDF, usaremos Aspose.PDF for Python. É uma biblioteca de manipulação de PDF rica em recursos que permite criar, editar e processar documentos PDF perfeitamente. Use o seguinte comando pip para instalar a biblioteca em seu aplicativo Python.

pip install aspose-pdf

Dividir um PDF por página em Python

Você pode precisar de diferentes critérios de divisão de PDF em cada situação, por exemplo, dividir cada página em um PDF, apenas páginas seletivas, apenas páginas pares e assim por diante. Primeiro, vamos dar uma olhada em como dividir um PDF por página em Python. Abaixo estão as etapas para realizar esta operação.

  • Carregue o arquivo PDF usando a classe Document.
  • Itere pelas páginas na coleção Document.pages.
  • Em cada iteração, execute as seguintes etapas:
    • Crie um novo objeto Document e adicione a página ao documento usando o método Document.pages.add(Page).
    • Salve o arquivo PDF usando o método Document.save().

O exemplo de código a seguir mostra como dividir cada página em um PDF usando Python.

import aspose.pdf as ap

# Carregar arquivo PDF
document = ap.Document("input.pdf")

# Percorra cada página
for page in document.pages:
    # Criar um novo PDF
    splitPDF = ap.Document()

    # Adicionar página ao PDF
    splitPDF.pages.add(page)

    # Salve o PDF
    splitPDF.save("Page_" + str(page.number) + ".pdf")

Dividir páginas específicas de PDF em Python

Vamos ver agora como dividir mais de uma página em um PDF e salvá-las em um arquivo separado. A seguir estão as etapas para dividir várias páginas PDF em Python.

  • Carregue o arquivo PDF usando a classe Document.
  • Crie um novo objeto Documento para o novo arquivo PDF.
  • Itere pelas páginas na coleção Document.pages.
  • Em cada iteração, verifique se a página deve ser dividida.
  • Adicione a página ao novo documento PDF usando o método Document.pages.add(Page).
  • Finalmente, salve o arquivo PDF usando o método Document.save().

O exemplo de código a seguir mostra como dividir uma coleção de páginas em um PDF usando Python.

import aspose.pdf as ap

# Carregar arquivo PDF
document = ap.Document("input.pdf")

# Criar um novo PDF
splitPDF = ap.Document()

# Percorra cada página
for page in document.pages:
    # Alguma condição aqui
    if page.number%2==0:
        # Adicionar Página
        splitPDF.pages.add(page)

# Salve o PDF
splitPDF.save("Split_PDF.pdf")

Dividir arquivos PDF on-line

Também fornecemos uma ferramenta on-line gratuita para dividir arquivos PDF, que é baseada em Aspose.PDF para Python.

Biblioteca gratuita de PDF Python

Você pode obter uma licença temporária gratuita para dividir arquivos PDF sem quaisquer limitações. Além disso, você pode visitar a documentação para explorar mais sobre a biblioteca Python PDF.

Conclusão

Neste artigo, você aprendeu como dividir os arquivos PDF em Python. Você viu como dividir cada página ou uma coleção de páginas em um PDF para separar arquivos. Você pode seguir facilmente as etapas fornecidas e os exemplos de código para dividir arquivos PDF em seu aplicativo Python.

Veja também