Convertir Word a Markdown en Python

Markdown (MD) es un formato popular que se usa para escribir artículos, blogs, documentación, etc. Sin embargo, a veces resulta difícil recordar y escribir la sintaxis de Markdown. En tales casos, simplemente puede escribir contenido en un documento de Word y convertirlo a Markdown. Para automatizar la conversión de Word a Markdown, este artículo cubre cómo convertir documentos de Word (.docx o .doc) a archivos Markdown (.md) usando Python.

Biblioteca de conversión de Word a Markdown de Python

Para convertir archivos DOCX o DOC a formato Markdown, usaremos Aspose.Words for Python. La API permite automatizar las funciones de procesamiento de texto desde las aplicaciones de Python. Puede crear los nuevos documentos de Word desde cero y manipular o convertir los existentes sin problemas. Aspose.Words for Python está alojado en PyPI y se puede instalar con el siguiente comando pip.

pip install aspose-words 

Convertir Word a Markdown en Python

Los siguientes son los pasos para convertir un DOCX de Word al formato Markdown.

  • Cargue el documento de Word usando la clase Document.
  • Convierta un documento de Word a Markdown usando el método Document.save(string).

El siguiente ejemplo de código muestra cómo convertir un archivo DOCX al formato Markdown usando Python.

import aspose.words as aw

# load document
doc = aw.Document("document.docx")

# save as markdown file
doc.save("document.md")

Personalizar la conversión de Word a Markdown

Aspose.Words también le permite controlar la conversión de Word a Markdown usando diferentes opciones. Por ejemplo, puede alinear el contenido de las tablas, especificar una carpeta para guardar imágenes, etc. Los siguientes pasos demuestran cómo usar estas opciones en la conversión de Word a Markdown usando Python.

  • Cargue el documento de Word usando la clase Document.
  • Cree un objeto de la clase MarkdownSaveOptions.
  • Establezca las opciones deseadas, como MarkdownSaveOptions.imagesfolder.
  • Convierta un documento de Word a rebajas usando el método Document.save(string, MarkdownSaveOptions).

El siguiente ejemplo de código muestra cómo configurar opciones adicionales en la conversión de DOCX a Markdown usando Python.

import aspose.words as aw

# load document
doc = aw.Document("document.docx")

# set options
saveOptions = aw.saving.MarkdownSaveOptions()
saveOptions.images_folder = "Images" 

# save as markdown file
doc.save("document.md", saveOptions)

Obtenga una licencia de API gratuita

Utilice Aspose.Words for Python sin limitaciones de evaluación mediante una licencia temporal gratuita.

Conclusión

En este artículo, aprendió cómo convertir documentos de Word a Markdown (.md) usando Python. Además, ha visto cómo controlar la conversión de Word a Markdown usando diferentes opciones. Además, puede visitar la documentación de Aspose.Words for Python para explorar otras funciones. También puede hacer sus preguntas a través de nuestro foro.

Ver también

Información: Puede estar interesado en otra API de Python (Aspose.Slides for Python via NET) que le permite convertir presentaciones (a PDF, documentos de Word, etc.) e importar imágenes u otros documentos en presentaciones.