PDF vers XLS en C# .NET

La conversion de fichiers PDF au format Excel devient essentielle lorsque vous devez exporter les données tabulaires de documents PDF vers des feuilles de calcul. En tant que programmeur, vous obtenez souvent les données tabulaires au format PDF et pour traiter ces données, elles doivent être converties au format Excel. Voyons donc comment le faire par programmation à partir d’applications .NET. Après avoir lu cet article, vous pourrez convertir un PDF en Excel XLS ou XLSX en C# .NET.

Cet article couvre les conversions PDF vers Excel suivantes.

Convertisseur C# .NET PDF vers Excel - Téléchargement gratuit

Pour convertir un fichier PDF en Excel XLS/XLS en C#, nous utiliserons Aspose.PDF for .NET. L’API prend en charge la création et la manipulation de documents PDF ainsi que la conversion de fichiers PDF vers d’autres formats avec une haute fidélité. Vous pouvez soit télécharger sa DLL ou l’installer à partir de NuGet en utilisant l’une des méthodes suivantes.

Convertisseur PDF vers Excel - Installation via le gestionnaire de packages NuGet

  • Ouvrez/créez le projet dans Visual Studio.
  • Accédez au gestionnaire de packages NuGet et recherchez Aspose.PDF.
  • Installez l’API.

Installer via la console du gestionnaire de packages

PM> Install-Package Aspose.PDF

Convertir un PDF en Excel XLS en C#

Pour convertir un document PDF en feuille de calcul XLS, vous pouvez simplement charger le fichier PDF et l’enregistrer avec l’extension “.xls”. Voici les étapes pour effectuer cette conversion.

  • Chargez le fichier PDF à l’aide de la classe Document.
  • Créez un objet de la classe ExcelSaveOptions.
  • Enregistrez le fichier PDF au format Excel XLS à l’aide de la méthode Document.Save(string, ExcelSaveOptions).

L’exemple de code suivant montre comment convertir un PDF en Excel XLS en C#.

// Charger le document PDF
Document pdfDocument = new Document("sampletable.pdf");
ExcelSaveOptions options = new ExcelSaveOptions(); 
// Enregistrer le fichier de sortie
pdfDocument.Save("Excel.xls", options);

Saisir un document PDF

Excel XLS converti

Convertir PDF en XLSX en C#

Par défaut, Aspose.PDF convertit le document PDF au format XLS. Si vous souhaitez obtenir la feuille de calcul Excel convertie au format XLSX, vous pouvez le spécifier à l’aide de la classe ExcelSaveOptions.

L’exemple de code suivant montre comment convertir un document PDF au format Excel au format XLSX à l’aide de C#.

// Charger le document PDF
Document pdfDocument = new Document("sampletable.pdf");
// Initialiser ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Définir le format de sortie
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Enregistrer le fichier de sortie
pdfDocument.Save("Excel.xlsx", options);

C# Exporter PDF vers Excel - Première colonne vide

Vous pouvez également insérer une première colonne vide dans la feuille de calcul Excel convertie. Cela peut être fait en utilisant l’option ExcelSaveOptions.InsertBlankColumnAtFirst.

  • Chargez le fichier PDF à l’aide de la classe Document.
  • Créez un objet de la classe ExcelSaveOptions.
  • (Facultatif) Définissez le format Excel de sortie sur XLSX à l’aide de la propriété ExcelSaveOptions.Format.
  • Définissez la propriété ExcelSaveOptions.InsertBlankColumnAtFirst sur true.
  • Enregistrez le fichier PDF au format Excel à l’aide de la méthode Document.Save(string, ExcelSaveOptions).

L’exemple de code suivant montre comment ajouter une première colonne vide dans la conversion PDF vers Excel.

// Charger le document PDF
Document pdfDocument = new Document("sampletable.pdf");
// Initialiser ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Définir le format de sortie
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Pour insérer une colonne vide comme première colonne de la feuille de calcul 
options.InsertBlankColumnAtFirst = true;
// Enregistrer le fichier de sortie
pdfDocument.Save("Excel.xlsx", options);

Enregistrer le PDF au format XLS en C# - Nombre de feuilles réduit

Par défaut, chaque page du document PDF d’entrée est convertie en une feuille de calcul distincte. Pour les documents PDF volumineux comportant un certain nombre de pages, la feuille de calcul Excel convertie contiendra également un certain nombre de feuilles de calcul. Dans un tel cas, vous pouvez personnaliser la conversion PDF vers Excel et minimiser le nombre de feuilles de calcul dans la feuille de calcul convertie. Voici les étapes pour effectuer cette personnalisation.

  • Chargez le fichier PDF à l’aide de la classe Document.
  • Créez un objet de la classe ExcelSaveOptions.
  • (Facultatif) Définissez le format Excel de sortie sur XLSX à l’aide de la propriété ExcelSaveOptions.Format.
  • Définissez la propriété ExcelSaveOptions.MinimizeTheNumberOfWorksheets sur true.
  • Enregistrez le fichier PDF au format XLS/XLSX à l’aide de la méthode Document.Save(string, ExcelSaveOptions).

L’exemple de code suivant montre comment réduire le nombre de feuilles de calcul dans la conversion PDF vers Excel en C#.

// Charger le document PDF
Document pdfDocument = new Document("sampletable.pdf");
// Initialiser ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Définir le format de sortie
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Minimiser le nombre de feuilles de travail
options.MinimizeTheNumberOfWorksheets = true;
// Enregistrer le fichier de sortie
pdfDocument.Save("Excel.xlsx", options);

Bibliothèque de conversion PDF vers Excel C# - Obtenez une licence gratuite

Vous pouvez [obtenir une licence temporaire gratuite][17] pour convertir des fichiers PDF au format Excel sans limitation d’évaluation.

Lire la suite

Si vous souhaitez explorer d’autres fonctionnalités d’Aspose.PDF, consultez la documentation ici.

Conclusion

Dans cet article, vous avez appris à convertir les fichiers PDF au format Excel par programmation en C#. De plus, vous avez vu comment personnaliser la conversion en utilisant différentes options. Vous pouvez facilement intégrer l’exemple de code fourni dans vos applications .NET.

Articles Liés

Documents PDF vers Excel XLS/XLSX en utilisant JavaConversion de documents Word en PDF par programmation dans C# .NETFichier PDF en texte en Python
XLSX vers JSON en JavaExcel vers JSON en JavaDOCX vers JSON en Java
DOC vers JSON en JavaWord en JSON en JavaTXT en JSON en Java
JSON en PDF en PythonExcel vers JSON en JavaTXT en JSON en Python
Convertir des documents Word en Markdown à l’aide de C#Convertir des documents Word en Markdown à l’aide de JavaConvertir des documents Word en TIFF en Python
Convertir Word en HTML en PythonConvertir Word en HTML à l’aide de C#Convertir Word en HTML en utilisant Java
Convertir Word en Markdown en Python