Converter Word para Markdown em Python

Markdown (MD) é um formato popular usado para escrever artigos, blogs, documentação, etc. No entanto, às vezes torna-se difícil lembrar e escrever a sintaxe do Markdown. Nesses casos, você pode simplesmente escrever conteúdo em um documento do Word e convertê-lo em Markdown. Para automatizar a conversão de Word para Markdown, este artigo aborda como converter documentos do Word (.docx ou .doc) em arquivos Markdown (.md) usando Python.

Biblioteca Python do conversor de Word para Markdown

Para converter arquivos DOCX ou DOC para o formato Markdown, usaremos Aspose.Words for Python. A API permite automatizar os recursos de processamento de texto de dentro dos aplicativos Python. Você pode criar os novos documentos do Word do zero e manipular ou converter os existentes sem problemas. O Aspose.Words for Python está hospedado em PyPI e pode ser instalado usando o seguinte comando pip.

pip install aspose-words 

Converter Word para Markdown em Python

A seguir estão as etapas para converter um formato Word DOCX para Markdown.

  • Carregue o documento do Word usando a classe Document.
  • Converta o documento do Word para Markdown usando o método Document.save(string).

O exemplo de código a seguir mostra como converter um arquivo DOCX para o formato Markdown usando Python.

import aspose.words as aw

# load document
doc = aw.Document("document.docx")

# save as markdown file
doc.save("document.md")

Personalize a conversão do Word para Markdown

Aspose.Words também permite que você controle a conversão de Word para Markdown usando diferentes opções. Por exemplo, você pode alinhar o conteúdo nas tabelas, especificar uma pasta para salvar imagens e assim por diante. As etapas a seguir demonstram como usar essas opções na conversão de Word para Markdown usando Python.

  • Carregue o documento do Word usando a classe Document.
  • Crie um objeto da classe MarkdownSaveOptions.
  • Defina as opções desejadas, como MarkdownSaveOptions.imagesfolder.
  • Converta o documento do Word em markdown usando o método Document.save(string, MarkdownSaveOptions).

O exemplo de código a seguir mostra como definir opções adicionais na conversão de DOCX para Markdown usando Python.

import aspose.words as aw

# load document
doc = aw.Document("document.docx")

# set options
saveOptions = aw.saving.MarkdownSaveOptions()
saveOptions.images_folder = "Images" 

# save as markdown file
doc.save("document.md", saveOptions)

Obtenha uma licença de API gratuita

Use Aspose.Words para Python sem limitações de avaliação usando uma licença temporária gratuita.

Conclusão

Neste artigo, você aprendeu como converter documentos do Word para Markdown (.md) usando Python. Além disso, você viu como controlar a conversão de Word para Markdown usando diferentes opções. Além disso, você pode visitar a documentação do Aspose.Words for Python para explorar outros recursos. Você também pode fazer suas perguntas através do nosso fórum.

Veja também

Informações: Você pode estar interessado em outra API Python (Aspose.Slides for Python via NET) que permite converter apresentações (em PDFs, documentos do Word, etc.) e importar imagens ou outros documentos em apresentações.