Dans cet âge de l’IA, Markdown est d’une immense importance en raison de sa convivialité. Ce langage de balisage est facile à comprendre tant pour les humains que pour les machines. De plus, ce format aide les LLM à mieux comprendre la structure des documents que HTML et DOCX. Par conséquent, dans ce guide, nous allons mettre en œuvre comment convertir HTML en Markdown en Python de manière programmatique. Nous allons utiliser Aspose.HTML pour Python via .NET car il est facile à configurer dans un projet Python. Ce kit de développement logiciel Python fournit des fonctionnalités de niveau entreprise pour automatiser la conversion et la manipulation de pages web. Alors, commençons.

Installation du SDK HTML à MD

C’est très simple. Il suffit d’exécuter la commande suivante dans votre terminal pour installer Aspose.HTML pour Python via .NET :

pip install aspose-html-net 

Vous ne voulez pas opter pour l’option terminal/CMD ? Nous avons ce qu’il vous faut. Vous pouvez télécharger le SDK à partir de ce lien.

webpage-to-md

Convertir HTML en Markdown en Python - Exemple de code

Cette section montre comment convertir une page web en Markdown de manière programmatique. Étapes :

  • Importez les modules nécessaires.
  • Initialisez un objet de la classe HTMLDocument avec un document HTML source.
  • Instanciez une instance de la classe MarkdownSaveOptions.
  • Invitez la méthode convert_html pour convertir HTML en MD.

L’exemple de code suivant automatise la conversion dans votre projet. Il est si facile de convertir HTML en Markdown en Python en utilisant Aspose.HTML pour Python via .NET. Sortie :

html-to-md

Obtenez une licence gratuite

Profitez d’une licence temporaire gratuite pour essayer ce SDK Python au-delà des limitations d’évaluation.

Posez une question

Vous avez des questions ? Ce forum répondra à toutes vos questions.

Conclusion

Jusqu’à présent, nous avons mis en œuvre la fonctionnalité de base. Cependant, vous pouvez explorer des options avancées en naviguant vers la section Guide du développeur. Il existe plusieurs classes et méthodes pour gérer différents scénarios. Maintenant, vous avez appris à convertir HTML en Markdown en Python en utilisant ce puissant SDK. De plus, vous pouvez passer à la référence API pour enrichir votre outil de conversion HTML en MD avec plus d’options.

De plus, Aspose.HTML propose également un outil en ligne gratuit pour la conversion HTML en MD.

En savoir plus