Convertir PDF en Excel en Python

La conversion de PDF en Excel peut être nécessaire dans divers cas, par exemple, pour exporter des données tabulaires au format PDF vers des feuilles de calcul, automatiser des tâches dans Excel et utiliser d’autres fonctionnalités de manipulation de données d’Excel. Lorsque vous travaillez avec des fichiers PDF et Excel par programme, vous devrez peut-être automatiser la conversion PDF vers Excel en Python. Pour ce faire, cet article vous propose la solution la plus simple pour convertir des fichiers PDF en Excel en Python.

De plus, vous apprendrez à personnaliser la conversion PDF vers Excel en utilisant différentes options. De plus, vous obtiendrez un convertisseur PDF vers Excel en ligne gratuit que vous pourrez utiliser n’importe où et à tout moment.

Convertisseur Python PDF vers Excel

Pour la conversion PDF vers Excel XLS/XLSX, nous utiliserons Aspose.PDF for Python. La bibliothèque est conçue pour créer, traiter et convertir des fichiers PDF à partir d’applications Python.

Utilisez la commande pip suivante pour installer la bibliothèque à partir de PyPI.

pip install aspose-pdf

Convertir un PDF en Excel XLS en Python

Aspose.PDF for Python a rendu plus facile la conversion d’un PDF en Excel XLS. Il vous suffit de charger le fichier PDF et de l’enregistrer au format XLS à l’emplacement souhaité. Vous pouvez suivre les étapes ci-dessous pour convertir un fichier PDF en XLS dans votre application Python.

  • Créez une instance de la classe Document et initialisez-la avec le chemin du fichier PDF d’entrée.
  • Créez un objet de la classe ExcelSaveOptions et définissez le format de sortie sur XMLSPREADSHEET2003.
  • Appelez la méthode Document.save() avec le nom du fichier XLS de sortie et ExcelSaveOptions comme arguments.

L’exemple de code suivant montre comment convertir un PDF en XLS en Python.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xls.xls"

# Ouvrir le fichier PDF
document = ap.Document(input_pdf)

# Créer et définir des options de sauvegarde
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003

# Enregistrez le fichier au format MS Excel
document.save(output_pdf, save_option)

Fichier PDF d’entrée

Comment convertir un PDF en XLS en Python

Feuille Excel convertie

Conversion PDF vers Excel en Python

Enregistrer le PDF au format XLSX en Python

Vous pouvez également convertir un PDF en XLSX de la même manière. Dans ce cas, vous n’avez pas besoin de spécifier de format de sortie. Enregistrez simplement le fichier Excel converti avec l’extension .xlsx. Voici les étapes pour convertir un PDF en XLSX en Python.

  • Chargez le fichier PDF à l’aide de la classe Document.
  • Créez un objet de la classe ExcelSaveOptions.
  • Appelez la méthode Document.save() et transmettez le nom du fichier de sortie et l’objet DocSaveOptions comme arguments.

L’exemple de code suivant montre comment convertir un PDF en XLSX en Python.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf =  DIR_OUTPUT + "convert_pdf_to_xlsx.xlsx"

# Ouvrir le document PDF
document = ap.Document(input_pdf)

# Créer des options de sauvegarde
save_option = ap.ExcelSaveOptions()

# Enregistrez le fichier dans XLSX
document.save(output_pdf, save_option)

Personnaliser la conversion PDF vers Excel

Vous pouvez également personnaliser la conversion PDF vers Excel en utilisant différentes options. Les sections suivantes montrent comment utiliser quelques-unes des options disponibles.

PDF vers Excel avec une première colonne vierge

Cette option permet d’ajouter une première colonne vide dans la feuille Excel convertie. Pour définir cette option, vous utiliserez la classe ExcelSaveOptions. L’exemple de code suivant montre comment utiliser cette option.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_with_control_column.xls"

# Ouvrir le document PDF
document = ap.Document(input_pdf)

# Créer des options de sauvegarde
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.insert_blank_column_at_first = True

# Enregistrez le fichier au format MS Excel
document.save(output_pdf, save_option)

Minimiser le nombre de feuilles de travail

Par défaut, chaque page du PDF est convertie en feuille dans le fichier Excel. Cependant, vous pouvez remplacer ce comportement pour minimiser le nombre de feuilles dans le fichier Excel. Pour cela, vous devez définir la propriété ExcelSaveOptions.minimizethenumberofworksheets sur True. L’exemple de code suivant montre comment réduire le nombre de feuilles dans la conversion PDF vers Excel.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "multipage.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_single_excel_worksheet.xls"

# Ouvrir le document PDF
document = ap.Document(input_pdf)

# Créer des options de sauvegarde
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.minimize_the_number_of_worksheets = True

# Enregistrez le fichier au format MS Excel
document.save(output_pdf, save_option)

Convertisseur PDF en Excel en ligne

Si vous souhaitez convertir des fichiers PDF au format Excel en ligne, utilisez notre convertisseur PDF vers Excel de haute qualité et gratuit, développé à l’aide de la bibliothèque Aspose.PDF.

Convertisseur gratuit de PDF en XLS

Vous pouvez obtenir une licence gratuite pour convertir des fichiers PDF au format Excel sans limitation d’évaluation.

Découvrez le convertisseur PDF vers Excel

Vous pouvez en savoir plus sur notre bibliothèque Python PDF en utilisant la documentation. N’hésitez pas non plus à nous faire part de vos questions via notre forum.

Conclusion

Dans cet article, vous avez appris à convertir des fichiers PDF en Excel en Python. Nous avons explicitement couvert la conversion de PDF en XLS et XLSX. De plus, vous avez vu comment personnaliser la conversion PDF vers Excel en utilisant différentes options. De plus, un convertisseur PDF vers Excel en ligne gratuit est fourni à la fin que vous pouvez utiliser pour convertir autant de fichiers PDF que vous le souhaitez.

Voir également