Converter PDF para Excel em Python

A conversão de PDF para Excel pode ser necessária em vários casos, por exemplo, para exportar dados tabulares em PDF para planilhas, automatizar tarefas no Excel e usar outros recursos de manipulação de dados do Excel. Ao trabalhar com arquivos PDF e Excel programaticamente, pode ser necessário automatizar a conversão de PDF para Excel em Python. Para conseguir isso, este artigo fornece a solução mais fácil para converter arquivos PDF para Excel em Python.

Além disso, você aprenderá como personalizar a conversão de PDF para Excel usando diferentes opções. Além disso, você receberá um conversor online gratuito de PDF para Excel que poderá usar em qualquer lugar e a qualquer momento.

Conversor Python PDF para Excel

Para conversão de PDF para Excel XLS/XLSX, usaremos Aspose.PDF for Python. A biblioteca foi projetada para criar, processar e converter arquivos PDF de aplicativos Python.

Use o seguinte comando pip para instalar a biblioteca de PyPI.

pip install aspose-pdf

Converter um PDF para Excel XLS em Python

Aspose.PDF para Python tornou muito mais fácil converter um PDF para Excel XLS. Você só precisa carregar o arquivo PDF e salvá-lo como XLS no local desejado. Você pode seguir as etapas abaixo para converter um arquivo PDF em XLS em seu aplicativo Python.

  • Crie uma instância da classe Document e inicialize-a com o caminho do arquivo PDF de entrada.
  • Crie um objeto da classe ExcelSaveOptions e defina o formato de saída para XMLSPREADSHEET2003.
  • Chame o método Document.save() com o nome do arquivo XLS de saída e ExcelSaveOptions como argumentos.

O exemplo de código a seguir mostra como converter PDF em XLS em Python.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xls.xls"

# Abrir arquivo PDF
document = ap.Document(input_pdf)

# Criar e definir opções de salvamento
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003

# Salve o arquivo no formato MS Excel
document.save(output_pdf, save_option)

Arquivo PDF de entrada

Como converter PDF para XLS em Python

Folha de Excel convertida

Conversão de PDF para Excel em Python

Salvar PDF como XLSX em Python

Você também pode converter PDF para XLSX de maneira semelhante. Nesse caso, você não precisa especificar nenhum formato de saída. Basta salvar o arquivo Excel convertido com a extensão .xlsx. A seguir estão as etapas para converter PDF para XLSX em Python.

  • Carregue o arquivo PDF usando a classe Document.
  • Crie um objeto da classe ExcelSaveOptions.
  • Chame o método Document.save() e passe o nome do arquivo de saída e o objeto DocSaveOptions como argumentos.

O exemplo de código a seguir mostra como converter PDF para XLSX em Python.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf =  DIR_OUTPUT + "convert_pdf_to_xlsx.xlsx"

# Abrir documento PDF
document = ap.Document(input_pdf)

# Criar opções de salvamento
save_option = ap.ExcelSaveOptions()

# Salve o arquivo em XLSX
document.save(output_pdf, save_option)

Personalize a conversão de PDF para Excel

Você também pode personalizar a conversão de PDF para Excel usando diferentes opções. As seções a seguir demonstram como usar algumas das opções disponíveis.

PDF para Excel com primeira coluna em branco

Esta opção é usada para adicionar uma primeira coluna em branco na planilha do Excel convertida. Para definir esta opção, você usará a classe ExcelSaveOptions. O exemplo de código a seguir mostra como usar essa opção.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_with_control_column.xls"

# Abrir documento PDF
document = ap.Document(input_pdf)

# Criar opções de salvamento
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.insert_blank_column_at_first = True

# Salve o arquivo no formato MS Excel
document.save(output_pdf, save_option)

Minimizar Número de Planilhas

Por padrão, cada página em PDF é convertida em uma planilha no arquivo Excel. No entanto, você pode substituir esse comportamento para minimizar o número de planilhas no arquivo do Excel. Para isso, você precisa definir a propriedade ExcelSaveOptions.minimizethenumberofworksheets como True. O exemplo de código a seguir mostra como minimizar o número de folhas na conversão de PDF para Excel.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "multipage.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_single_excel_worksheet.xls"

# Abrir documento PDF
document = ap.Document(input_pdf)

# Criar opções de salvamento
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.minimize_the_number_of_worksheets = True

# Salve o arquivo no formato MS Excel
document.save(output_pdf, save_option)

Conversor de PDF para Excel Online

Se você deseja converter arquivos PDF para o formato Excel online, use nosso conversor de PDF para Excel gratuito e de alta qualidade, desenvolvido usando a biblioteca Aspose.PDF.

Conversor PDF para XLS Grátis

Você pode obter uma licença gratuita para converter arquivos PDF para o formato Excel sem limitações de avaliação.

Explore o Conversor de PDF para Excel

Você pode aprender mais sobre nossa biblioteca Python PDF usando a documentação. Além disso, sinta-se à vontade para nos informar sobre suas dúvidas através do nosso fórum.

Conclusão

Neste artigo, você aprendeu como converter arquivos PDF para Excel em Python. Cobrimos explicitamente a conversão de PDF para XLS e XLSX. Além disso, você viu como personalizar a conversão de PDF para Excel usando diferentes opções. Além disso, um conversor online gratuito de PDF para Excel é fornecido no final, que você pode usar para converter quantos arquivos PDF quiser.

Veja também