PDF in Excel in C# .NET

La conversione da PDF a Excel è un caso d’uso importante quando è necessario esportare i dati tabulari da documenti PDF a fogli di calcolo Excel. Copiare/esportare manualmente i dati da PDF a Excel potrebbe essere un’attività dispendiosa in termini di tempo quando si ha a che fare con una serie di documenti. Allora perché non automatizzare questo processo e ridurre al minimo il tempo e lo sforzo? In questo articolo imparerai come convertire PDF in Excel a livello di codice usando C# .NET.

Conversione da PDF a Excel in C# .NET

Questo articolo illustra le seguenti conversioni da PDF a Excel utilizzando C#.

  • Conversione da PDF in formato XLS.
  • Conversione da PDF in formato XLSX.
  • Inserimento di una prima colonna vuota nel foglio di lavoro di Excel convertito.
  • Ridurre al minimo il numero di fogli di lavoro nel foglio di calcolo Excel convertito.

Per la conversione da PDF a Excel in C#, utilizzeremo l’API Aspose.PDF for .NET che supporta la creazione e la manipolazione di documenti PDF e la conversione di file PDF in altri formati. Puoi scaricare DLL dell’API o installarla utilizzando uno dei seguenti modi.

Installa tramite Gestione pacchetti NuGet

  • Apri/crea il progetto in Visual Studio.
  • Vai a NuGet Package Manager e cerca Aspose.PDF.
  • Installa l’API.

Installa tramite Package Manager Console

PM> Install-Package Aspose.PDF

Conversione da PDF a XLS in C#

Per convertire un documento PDF nel foglio di calcolo XLS, puoi semplicemente caricare il file PDF e salvarlo con l’estensione “.xls”. L’esempio di codice seguente mostra come convertire PDF in Excel in formato XLS usando C#.

// Carica documento PDF
Document pdfDocument = new Document("sampletable.pdf");
ExcelSaveOptions options = new ExcelSaveOptions(); 
// Salva file di output
pdfDocument.Save("Excel.xls", options);

Documento PDF

Foglio di calcolo Excel convertito

Conversione da PDF a XLSX in C#

Per impostazione predefinita, Aspose.PDF converte il documento PDF in formato XLS. Nel caso in cui desideri ottenere il foglio di calcolo Excel convertito in formato XLSX, puoi specificarlo utilizzando la classe ExcelSaveOptions. L’esempio di codice seguente mostra come convertire un documento PDF in Excel con il formato XLSX usando C#.

// Carica documento PDF
Document pdfDocument = new Document("sampletable.pdf");
// Inizializza ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Imposta il formato di output
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Salva file di output
pdfDocument.Save("Excel.xlsx", options);

Converti PDF in Excel con una prima colonna vuota

Puoi anche inserire una prima colonna vuota nel foglio di calcolo di Excel convertito. Questa operazione può essere eseguita utilizzando l’opzione ExcelSaveOptions.InsertBlankColumnAtFirst come illustrato nell’esempio di codice seguente.

// Carica documento PDF
Document pdfDocument = new Document("sampletable.pdf");
// Inizializza ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Imposta il formato di output
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Per inserire una colonna vuota come prima colonna nel foglio di lavoro 
options.InsertBlankColumnAtFirst = true;
// Salva file di output
pdfDocument.Save("Excel.xlsx", options);

Converti PDF in Excel con un numero ridotto di fogli di lavoro

Per impostazione predefinita, ogni pagina del documento PDF di input viene convertita in un foglio di lavoro separato. Per i documenti PDF di grandi dimensioni con un numero di pagine, il foglio di calcolo Excel convertito conterrà anche un numero di fogli di lavoro. In tal caso, puoi personalizzare la conversione da PDF a Excel e ridurre al minimo il numero di fogli di lavoro nel foglio di lavoro convertito utilizzando l’opzione ExcelSaveOptions.MinimizeTheNumberOfWorksheets.

L’esempio di codice seguente mostra come ridurre al minimo il numero di fogli di lavoro nella conversione da PDF a Excel usando C#.

// Carica documento PDF
Document pdfDocument = new Document("sampletable.pdf");
// Inizializza ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Imposta il formato di output
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Riduci al minimo il numero di fogli di lavoro
options.MinimizeTheNumberOfWorksheets = true;
// Salva file di output
pdfDocument.Save("Excel.xlsx", options);

Leggi di più su Aspose.PDF per .NET qui.

Articoli Correlati