Converti PDF in Excel in Python

La conversione da PDF a Excel potrebbe essere richiesta in vari casi, ad esempio per esportare dati tabulari in PDF in fogli di calcolo, automatizzare attività in Excel e utilizzare altre funzionalità di manipolazione dei dati di Excel. Mentre si lavora con file PDF ed Excel a livello di codice, potrebbe essere necessario automatizzare la conversione da PDF a Excel in Python. Per fare ciò, questo articolo ti fornisce la soluzione più semplice per convertire i file PDF in Excel in Python.

Inoltre, imparerai come personalizzare la conversione da PDF a Excel utilizzando diverse opzioni. Inoltre, otterrai un convertitore online gratuito da PDF a Excel che puoi utilizzare ovunque e in qualsiasi momento.

Convertitore Python da PDF a Excel

Per la conversione da PDF a Excel XLS/XLSX, useremo Aspose.PDF for Python. La libreria è progettata per creare, elaborare e convertire file PDF dall’interno delle applicazioni Python.

Utilizzare il seguente comando pip per installare la libreria da PyPI.

pip install aspose-pdf

Converti un PDF in Excel XLS in Python

Aspose.PDF for Python ha reso molto più semplice convertire un PDF in Excel XLS. Devi solo caricare il file PDF e salvarlo come XLS nella posizione desiderata. Puoi seguire i passaggi indicati di seguito per convertire un file PDF in XLS nella tua applicazione Python.

  • Creare un’istanza della classe Document e inizializzarla con il percorso del file PDF di input.
  • Creare un oggetto della classe ExcelSaveOptions e impostare il formato di output su XMLSPREADSHEET2003.
  • Chiamare il metodo Document.save() con il nome del file XLS di output e ExcelSaveOptions come argomenti.

Il seguente esempio di codice mostra come convertire PDF in XLS in Python.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xls.xls"

# Apri file PDF
document = ap.Document(input_pdf)

# Crea e imposta le opzioni di salvataggio
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003

# Salva il file in formato MS Excel
document.save(output_pdf, save_option)

Immettere il file PDF

Come convertire PDF in XLS in Python

Foglio Excel convertito

Conversione da PDF a Excel in Python

Salva PDF come XLSX in Python

Puoi anche convertire PDF in XLSX in modo simile. In questo caso, non è necessario specificare alcun formato di output. Basta salvare il file Excel convertito con estensione .xlsx. Di seguito sono riportati i passaggi per convertire PDF in XLSX in Python.

  • Carica il file PDF utilizzando la classe Documento.
  • Creare un oggetto della classe ExcelSaveOptions.
  • Chiama il metodo Document.save() e passa il nome del file di output e l’oggetto DocSaveOptions come argomenti.

Il seguente esempio di codice mostra come convertire PDF in XLSX in Python.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf =  DIR_OUTPUT + "convert_pdf_to_xlsx.xlsx"

# Apri documento PDF
document = ap.Document(input_pdf)

# Crea opzioni di salvataggio
save_option = ap.ExcelSaveOptions()

# Salva il file in XLSX
document.save(output_pdf, save_option)

Personalizza la conversione da PDF a Excel

Puoi anche personalizzare la conversione da PDF a Excel utilizzando diverse opzioni. Le sezioni seguenti mostrano come utilizzare alcune delle opzioni disponibili.

Da PDF a Excel con la prima colonna vuota

Questa opzione viene utilizzata per aggiungere una prima colonna vuota nel foglio Excel convertito. Per impostare questa opzione, utilizzerai la classe ExcelSaveOptions. L’esempio di codice seguente mostra come utilizzare questa opzione.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_with_control_column.xls"

# Apri documento PDF
document = ap.Document(input_pdf)

# Crea opzioni di salvataggio
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.insert_blank_column_at_first = True

# Salva il file in formato MS Excel
document.save(output_pdf, save_option)

Riduci al minimo il numero di fogli di lavoro

Per impostazione predefinita, ogni pagina in PDF viene convertita in un foglio nel file Excel. Tuttavia, puoi ignorare questo comportamento per ridurre al minimo il numero di fogli nel file Excel. Per questo, è necessario impostare la proprietà ExcelSaveOptions.minimizethenumberofworksheets su True. L’esempio di codice seguente mostra come ridurre al minimo il numero di fogli nella conversione da PDF a Excel.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "multipage.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_single_excel_worksheet.xls"

# Apri documento PDF
document = ap.Document(input_pdf)

# Crea opzioni di salvataggio
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.minimize_the_number_of_worksheets = True

# Salva il file in formato MS Excel
document.save(output_pdf, save_option)

Convertitore online da PDF a Excel

Se desideri convertire i file PDF in formato Excel online, utilizza il nostro convertitore PDF in Excel di alta qualità e gratuito, sviluppato utilizzando la libreria Aspose.PDF.

Convertitore gratuito da PDF a XLS

Puoi ottenere una licenza gratuita per convertire i file PDF in formato Excel senza limitazioni di valutazione.

Esplora Convertitore da PDF a Excel

Puoi saperne di più sulla nostra libreria Python PDF utilizzando la documentazione. Inoltre, non esitare a comunicarci le tue domande tramite il nostro forum.

Conclusione

In questo articolo, hai imparato come convertire i file PDF in Excel in Python. Abbiamo coperto esplicitamente la conversione di PDF in XLS e XLSX. Inoltre, hai visto come personalizzare la conversione da PDF a Excel utilizzando diverse opzioni. Inoltre, alla fine viene fornito un convertitore online gratuito da PDF a Excel che puoi utilizzare per convertire tutti i file PDF che desideri.

Guarda anche