En esta era de la inteligencia artificial, Markdown se le da una inmensa importancia debido a su usabilidad. Este lenguaje de marcado es fácil de entender tanto para humanos como para máquinas. Además, este formato ayuda a los LLM a comprender mejor la estructura del documento que HTML y DOCX. Por lo tanto, en esta guía, implementaremos cómo convertir HTML a Markdown en Python de manera programática. Usaremos Aspose.HTML para Python a través de .NET ya que es fácil de configurar en un proyecto de Python. Este kit de desarrollo de software de Python proporciona características de nivel empresarial para automatizar la conversión y manipulación de páginas web. Así que, comencemos.
HTML a MD - Instalación del SDK
Es todo muy simple. Simplemente ejecute el siguiente comando en su terminal para instalar Aspose.HTML para Python a través de .NET:
pip install aspose-html-net
¿No quiere optar por la opción de terminal/CMD? Lo tenemos cubierto. Puede descargar el SDK desde este enlace.
Convertir HTML a Markdown en Python - Ejemplo de Código
Esta sección muestra cómo convertir una página web a Markdown de manera programática. Pasos:
- Importar los módulos necesarios.
- Inicializar un objeto de la clase HTMLDocument con un documento HTML fuente.
- Instanciar una instancia de la clase MarkdownSaveOptions.
- Invocar el método convert_html para convertir HTML a MD.
El siguiente ejemplo de código automatiza la conversión en su proyecto. Es muy fácil convertir HTML a Markdown en Python utilizando Aspose.HTML para Python a través de .NET.
Salida:
Obtener una Licencia Gratuita
Obtenga una licencia temporal gratuita para probar este SDK de Python más allá de las limitaciones de evaluación.
Hacer una pregunta
¿Tiene preguntas? Este foro responderá todas sus preguntas.
Conclusión
Hasta ahora, hemos implementado la funcionalidad básica. Sin embargo, puede explorar opciones avanzadas navegando a la sección Guía del desarrollador. Hay varias clases y métodos para manejar múltiples escenarios. Ahora, ha aprendido cómo convertir HTML a Markdown en Python utilizando este poderoso SDK. Además, puede saltar a la referencia de la API para enriquecer su herramienta de conversión de HTML a MD con más opciones.
Además, Aspose.HTML también respalda una herramienta en línea gratuita para la conversión de HTML a MD.