Les pages Web contiennent fréquemment des données tabulaires, telles que des rapports, des listes de prix ou des statistiques, formatées dans des tableaux HTML.Travailler avec des données web nécessite souvent de convertir des tableaux ou des pages HTML en feuilles de calcul Excel pour l’analyse ou le reporting. L’exportation de ces derniers vers Excel permet de trier, filtrer et effectuer des calculs. L’automatisation de ce processus avec Python garantit l’exactitude et fait gagner du temps, en particulier lors du traitement de grands ensembles de données ou de ensembles de données répétitifs. Dans ce guide, vous apprendrez comment convertir HTML en Excel en Python avec juste quelques lignes de code.

Bibliothèque de conversion HTML en Excel pour Python

Aspose.Cells for Python via .NET est une bibliothèque d’automatisation de tableurs haute performance qui permet aux développeurs Python de créer, modifier et convertir des fichiers Excel sans utiliser Microsoft Excel.

Il prend en charge la lecture et l’écriture d’un large éventail de formats, y compris XLS, XLSX, CSV, HTML, ODS, et plus encore. Les développeurs peuvent également manipuler des formules, appliquer des formats, insérer des graphiques et traiter des feuilles de calcul complexes de manière programmatique. Cette flexibilité en fait un outil idéal pour les tâches d’automatisation telles que la conversion de rapports HTML, de factures ou de tableaux en classeurs Excel pour un traitement ou une distribution ultérieurs.

Avant d’écrire du code, téléchargez-le depuis les releases ou installez le package depuis PyPI.Exécutez la commande suivante dans votre terminal :

pip install aspose-cells-python 

Cela installe l’API et ses dépendances, la rendant prête à être utilisée dans tout projet Python.

Convertir HTML en Excel en Python

Aspose.Cells permet la conversion directe d’un fichier ou d’une chaîne HTML en un classeur Excel. Vous pouvez ensuite l’enregistrer au format XLSX, XLS ou d’autres formats pris en charge.

Suivez les étapes ci-dessous pour charger HTML et enregistrer en tant qu’Excel :

  1. Charger le fichier HTML en utilisant la classe Workbook.
  2. Enregistrez le classeur au format XLSX.

Le code suivant charge un fichier HTML et l’exporte au format Excel en Python.

from aspose.cells import Workbook

# Étape 1 : Définir le chemin du fichier HTML d'entrée
input_file = "sample.html"

# Étape 2 : Créez un objet Workbook et chargez le HTML
workbook = Workbook(input_file)

# Étape 3 : Enregistrez le fichier au format Excel
workbook.save("output.xlsx")
Convertir HTML en Excel en utilisant Python

Convert HTML to Excel using Python.

Convertir une chaîne HTML en Excel

Parfois, le contenu HTML est disponible en mémoire au lieu d’un fichier. Aspose.Cells vous permet de convertir des chaînes HTML directement sans les enregistrer d’abord. Cette méthode est parfaite pour convertir du contenu HTML dynamique en fichiers Excel à la volée, comme dans des scripts de web scraping ou d’extraction de données.

Suivez les étapes ci-dessous pour convertir une chaîne HTML en Excel :

  1. Initialisez le classeur en utilisant un flux mémoire contenant du contenu HTML.
  2. Save the result as an Excel file.

Le code d’exemple suivant montre comment exporter une chaîne HTML dans une feuille de calcul Excel :

from aspose.cells import Workbook, HtmlLoadOptions
from io import BytesIO

# Étape 1 : Définir la chaîne HTML
html_data = """
<table border='1'>
<tr><th>Product</th><th>Price</th><th>Quantity</th></tr>
<tr><td>Laptop</td><td>800</td><td>5</td></tr>
<tr><td>Phone</td><td>400</td><td>10</td></tr>
</table>
"""

# Étape 2 : Convertir une chaîne HTML en octets
html_bytes = BytesIO(html_data.encode('utf-8'))

# Étape 3 : Charger le HTML à partir de la mémoire
options = HtmlLoadOptions()
workbook = Workbook(html_bytes, options)

# Étape 4 : Enregistrer sous Excel
workbook.save("from_string.xlsx")
Convertir une chaîne HTML en Excel en utilisant Python

Convertir une chaîne HTML en Excel en utilisant Python.

Options avancées pour la conversion HTML en Excel

Aspose.Cells fournit un contrôle avancé sur la façon dont vos fichiers HTML sont lus et enregistrés. Vous pouvez utiliser la classe HtmlLoadOptions pour gérer les images intégrées, le formatage ou l’encodage.

Suivez les étapes ci-dessous pour personnaliser le chargement des fichiers HTML :

  1. Créer une instance de la classe HtmlLoadOptions.
  2. Specify HTML load options.
  3. Charger le HTML avec des options en utilisant la classe Workbook.
  4. Enregistrez en tant qu’Excel en utilisant la méthode save().

Le suivant exemple de code utilise HtmlLoadOptions pour gérer le HTML avec des paramètres spécifiques et enregistrer en tant que fichier Excel.

from aspose.cells import Workbook, HtmlLoadOptions

# Étape 1 : Définir les options de chargement HTML
load_options = HtmlLoadOptions()
load_options.auto_fit_cols_and_rows = True  # Automatically adjusts columns and rows

# Étape 2 : Charger le HTML avec des options
workbook = Workbook("sample.html", load_options)

# Étape 3 : Enregistrer sous Excel
workbook.save("table_advanced.xlsx")
Convertir HTML en Excel en utilisant Python - Options avancées

Options avancées pour la conversion HTML en Excel.

Quand utiliser les options de chargement

Utilisez ces options lorsque :

  • Votre HTML comprend de grandes tables ou des cellules fusionnées.
  • Vous voulez préserver les largeurs et les styles des colonnes.
  • Vous devez automatiquement ajuster la mise en page pour une meilleure lisibilité.

Convertir HTML en plusieurs formats Excel

Aspose.Cells permet d’enregistrer la sortie dans différents formats de feuille de calcul en fonction de vos besoins. Il permet l’intégration dans des pipelines de données, des tableaux de bord ou des outils d’automatisation nécessitant différents formats d’exportation.

from aspose.cells import Workbook

workbook = Workbook("sample.html")

# Enregistrer au format XLS
workbook.save("output.xls")

# Enregistrer au format CSV
workbook.save("output.csv")

# Enregistrer au format PDF pour le reporting
workbook.save("output.pdf")

Obtenez une licence gratuite

Évaluez Aspose.Cells for Python via .NET sans limitations. Demandez une licence temporaire gratuite sur la Aspose License Page.Appliquez-la dans votre code pour explorer toutes les fonctionnalités premium, de la gestion de fichiers volumineux à la mise en forme avancée et à la manipulation de graphiques.

Convert HTML to Excel Online

Si vous souhaitez convertir rapidement votre contenu HTML en format Excel sans écrire de code, essayez le convertisseur en ligne Aspose.Cells HTML to Excel online converter.

Convertisseur HTML vers Excel gratuit en ligne
Input file
Output format
  

Cette application web gratuite fonctionne directement dans votre navigateur et prend en charge plusieurs formats, y compris HTML, XLS, XLSX, CSV et ODS. Vous pouvez télécharger un fichier, choisir le format de sortie et télécharger instantanément l’Excel converti.

Python HTML to Excel : Ressources gratuites

En plus de la conversion de HTML en Excel, Aspose.Cells for Python via .NET prend en charge les conversions de fichiers, la génération de graphiques, les formules, le formatage et les tableaux croisés dynamiques. Les développeurs peuvent l’utiliser pour créer ou traiter des fichiers Excel sans Microsoft Office. Utilisez les ressources suivantes pour explorer des fonctionnalités plus avancées :

Conclusion

La conversion de HTML en Excel en Python est une méthode puissante pour intégrer des données basées sur le web dans votre environnement d’analyse ou de rapport. Avec Aspose.Cells for Python, vous pouvez réaliser cette conversion en quelques lignes de code tout en maintenant l’exactitude, le formatage et les performances. Que vous soyez en train de créer un script de traitement de données ou d’intégrer des rapports web dans des tableaux de bord Excel, Aspose.Cells vous fournit tous les outils nécessaires.

Avez-vous une question ou besoin d’aide technique ? Visitez notre Free Support Forum pour vous connecter directement avec nos experts. Notre équipe est prête à vous aider à résoudre des problèmes et à vous guider dans votre projet.

Questions Fréquemment Posées (FAQs)

1. Puis-je convertir HTML directement en Excel en utilisant Python ?

Oui. Vous pouvez convertir n’importe quel fichier HTML ou chaîne contenant des données de tableau directement en Excel en utilisant la bibliothèque Aspose.Cells for Python via .NET. Elle lit la structure HTML et préserve les tables, le formatage et les styles dans le fichier Excel de sortie.

2. Aspose.Cells prend-il en charge la conversion de chaînes HTML en Excel ?

Absolument. Vous pouvez charger du contenu HTML à partir d’une chaîne ou d’un flux mémoire au lieu d’un fichier. Cela est utile lorsque le HTML est généré dynamiquement à partir de données Web, d’APIs ou d’une saisie utilisateur.

3. Quels formats de sortie sont pris en charge en plus de XLSX ?

En plus de XLSX, vous pouvez exporter votre HTML vers XLS, CSV, ODS, PDF et d’autres formats pris en charge par Aspose.Cells. Vous devez simplement spécifier le SaveFormat souhaité lors de l’enregistrement du classeur.

4. Ai-je besoin de Microsoft Excel installé pour utiliser Aspose.Cells ?

Non. Aspose.Cells est une bibliothèque Python autonome qui ne dépend pas de Microsoft Excel ou Office. Vous pouvez effectuer toutes les conversions par programme sur n’importe quel système.

5. Existe-t-il un outil en ligne pour convertir HTML en Excel sans codage ?

Oui, Aspose propose un convertisseur HTML en Excel en ligne gratuit où vous pouvez télécharger un fichier HTML et télécharger instantanément le résultat Excel.

6. Aspose.Cells peut-il gérer de grandes ou complexes tables HTML ?

Oui. Aspose.Cells est conçu pour le traitement de données à haute performance. Il gère efficacement de grands fichiers HTML contenant plusieurs tableaux, images ou mises en page complexes, garantissant une sortie Excel précise.

Voir aussi