![Converter PDF para Excel em Python](images/Convert%20PDF%20to%20Excel%20in%20Python.png#center)
A conversão de PDF para Excel pode ser necessária em vários casos, por exemplo, para exportar dados tabulares em PDF para planilhas, automatizar tarefas no Excel e usar outros recursos de manipulação de dados do Excel. Ao trabalhar com arquivos PDF e Excel programaticamente, pode ser necessário automatizar a conversão de PDF para Excel em Python. Para conseguir isso, este artigo fornece a solução mais fácil para converter arquivos PDF para Excel em Python.
Além disso, você aprenderá como personalizar a conversão de PDF para Excel usando diferentes opções. Além disso, você receberá um conversor online gratuito de PDF para Excel que poderá usar em qualquer lugar e a qualquer momento.
- Conversor Python PDF para Excel
- Converter PDF para XLS em Python
- Converter PDF para XLSX em Python
- Personalize a conversão de PDF para Excel
- Conversor de PDF para Excel Online
Conversor Python PDF para Excel
Para conversão de PDF para Excel XLS/XLSX, usaremos Aspose.PDF for Python. A biblioteca foi projetada para criar, processar e converter arquivos PDF de aplicativos Python.
Use o seguinte comando pip para instalar a biblioteca de PyPI.
pip install aspose-pdf
Converter um PDF para Excel XLS em Python
Aspose.PDF para Python tornou muito mais fácil converter um PDF para Excel XLS. Você só precisa carregar o arquivo PDF e salvá-lo como XLS no local desejado. Você pode seguir as etapas abaixo para converter um arquivo PDF em XLS em seu aplicativo Python.
- Crie uma instância da classe Document e inicialize-a com o caminho do arquivo PDF de entrada.
- Crie um objeto da classe ExcelSaveOptions e defina o formato de saída para XMLSPREADSHEET2003.
- Chame o método Document.save() com o nome do arquivo XLS de saída e ExcelSaveOptions como argumentos.
O exemplo de código a seguir mostra como converter PDF em XLS em Python.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xls.xls"
# Abrir arquivo PDF
document = ap.Document(input_pdf)
# Criar e definir opções de salvamento
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
# Salve o arquivo no formato MS Excel
document.save(output_pdf, save_option)
Arquivo PDF de entrada
![Como converter PDF para XLS em Python](images/convert-pdf-to-xls.png#center)
Folha de Excel convertida
![Conversão de PDF para Excel em Python](images/converted-excel-file.png#center)
Salvar PDF como XLSX em Python
Você também pode converter PDF para XLSX de maneira semelhante. Nesse caso, você não precisa especificar nenhum formato de saída. Basta salvar o arquivo Excel convertido com a extensão .xlsx. A seguir estão as etapas para converter PDF para XLSX em Python.
- Carregue o arquivo PDF usando a classe Document.
- Crie um objeto da classe ExcelSaveOptions.
- Chame o método Document.save() e passe o nome do arquivo de saída e o objeto DocSaveOptions como argumentos.
O exemplo de código a seguir mostra como converter PDF para XLSX em Python.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx.xlsx"
# Abrir documento PDF
document = ap.Document(input_pdf)
# Criar opções de salvamento
save_option = ap.ExcelSaveOptions()
# Salve o arquivo em XLSX
document.save(output_pdf, save_option)
Personalize a conversão de PDF para Excel
Você também pode personalizar a conversão de PDF para Excel usando diferentes opções. As seções a seguir demonstram como usar algumas das opções disponíveis.
PDF para Excel com primeira coluna em branco
Esta opção é usada para adicionar uma primeira coluna em branco na planilha do Excel convertida. Para definir esta opção, você usará a classe ExcelSaveOptions. O exemplo de código a seguir mostra como usar essa opção.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_with_control_column.xls"
# Abrir documento PDF
document = ap.Document(input_pdf)
# Criar opções de salvamento
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.insert_blank_column_at_first = True
# Salve o arquivo no formato MS Excel
document.save(output_pdf, save_option)
Minimizar Número de Planilhas
Por padrão, cada página em PDF é convertida em uma planilha no arquivo Excel. No entanto, você pode substituir esse comportamento para minimizar o número de planilhas no arquivo do Excel. Para isso, você precisa definir a propriedade ExcelSaveOptions.minimizethenumberofworksheets como True. O exemplo de código a seguir mostra como minimizar o número de folhas na conversão de PDF para Excel.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "multipage.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_single_excel_worksheet.xls"
# Abrir documento PDF
document = ap.Document(input_pdf)
# Criar opções de salvamento
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.minimize_the_number_of_worksheets = True
# Salve o arquivo no formato MS Excel
document.save(output_pdf, save_option)
Conversor de PDF para Excel Online
Se você deseja converter arquivos PDF para o formato Excel online, use nosso conversor de PDF para Excel gratuito e de alta qualidade, desenvolvido usando a biblioteca Aspose.PDF.
![](images/PDF%20to%20Excel%20Online%20Converter.png)
Conversor PDF para XLS Grátis
Você pode obter uma licença gratuita para converter arquivos PDF para o formato Excel sem limitações de avaliação.
Explore o Conversor de PDF para Excel
Você pode aprender mais sobre nossa biblioteca Python PDF usando a documentação. Além disso, sinta-se à vontade para nos informar sobre suas dúvidas através do nosso fórum.
Conclusão
Neste artigo, você aprendeu como converter arquivos PDF para Excel em Python. Cobrimos explicitamente a conversão de PDF para XLS e XLSX. Além disso, você viu como personalizar a conversão de PDF para Excel usando diferentes opções. Além disso, um conversor online gratuito de PDF para Excel é fornecido no final, que você pode usar para converter quantos arquivos PDF quiser.