Palavra para HTML Python

A conversão de Word para HTML é necessária em vários casos, como para incorporar o conteúdo do documento nas páginas da web. Neste artigo, você aprenderá como converter documentos do MS Word DOCX ou DOC em HTML usando Python. Além disso, você aprenderá como controlar a conversão de Word para HTML dinamicamente usando diferentes opções.

Python Word to HTML Converter API

Para converter documentos do Word para HTML, usaremos Aspose.Words for Python. É uma API poderosa e rica em recursos para criar e manipular documentos do Word. Além disso, fornece uma conversão de alta fidelidade de documentos do Word para outros formatos. O Aspose.Words for Python está disponível em PyPI e você pode instalá-lo usando o seguinte comando pip.

pip install aspose-words 

Converter um documento do Word para HTML em Python

A seguir estão as etapas para converter um documento do Word em um arquivo HTML usando Python.

  • Carregue o documento do Word usando a classe Document.
  • Crie um objeto da classe HtmlSaveOptions.
  • Habilite a exportação de recursos de fonte usando a propriedade HtmlSaveOptions.exportfontresources.
  • Converta o documento do Word em HTML usando o método Document.save().

O exemplo de código a seguir mostra como converter um arquivo DOCX em HTML em Python.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Enable export of fonts
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
  
# Save the document as HTML
doc.save("Document.html", options)

Personalize a conversão de Word para HTML em Python

Aspose.Words for Python também oferece diferentes opções para personalizar a conversão de Word para HTML. Por exemplo, você pode converter documentos com informações de ida e volta, especificar a pasta para salvar os arquivos de recursos e assim por diante.

Converter um documento do Word com informações de ida e volta

O HTML não suporta todos os recursos fornecidos pelo MS Word, portanto, para imitar o documento do Word em HTML, precisamos salvar informações adicionais denominadas informações de ida e volta. A seguir estão as etapas para ativar a exportação de informações de ida e volta na conversão do Word para HTML.

  • Carregue o documento do Word usando a classe Document.
  • Crie um objeto da classe HtmlSaveOptions e defina a propriedade HtmlSaveOptions.exportroundtripinformation como true.
  • Converta o documento do Word para HTML usando o método Document.save() e passe o nome do arquivo HTML e HtmlSaveOptions como parâmetros.

O exemplo de código a seguir mostra como exportar informações de ida e volta na conversão do Word para HTML.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Enable round-trip information
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True 

# Save the document as HTML
doc.save("Document.html", saveOptions)

Word para HTML: especifique uma pasta para recursos

Você também pode especificar uma pasta na qual deseja armazenar todos os recursos, como imagens, arquivos CSS e fontes. Para isso, você pode usar a propriedade HtmlSaveOptions.exportfontresources. Você também pode especificar pastas separadas para fontes e imagens usando as propriedades HtmlSaveOptions.fontsfolder e HtmlSaveOptions.imagesfolder, respectivamente. A seguir estão as etapas para usar uma pasta separada para salvar recursos na conversão de Word para HTML.

  • Carregue o documento do Word usando a classe Document.
  • Crie um objeto da classe HtmlSaveOptions e defina a propriedade HtmlSaveOptions.exportfontresources como true.
  • Especifique o nome da pasta de recursos usando a propriedade HtmlSaveOptions.resourcefolder.
  • Converta o documento do Word para HTML usando o método Document.save() e passe o nome do arquivo HTML e HtmlSaveOptions como parâmetros.

O exemplo de código a seguir mostra como especificar uma pasta de recursos na conversão de Word para HTML.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Specify resource folder
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"

# Save the document as HTML
doc.save("Document.html", saveOptions)

Obtenha uma licença de API gratuita

Você pode obter uma licença temporária para usar o Aspose.Words for Python sem limitações de avaliação.

Conclusão

Neste artigo, você aprendeu como converter documentos do Word em HTML usando Python. Além disso, você viu como personalizar a conversão de Word para HTML dinamicamente. Além disso, você pode explorar outros recursos do Aspose.Words for Python usando a documentação. Além disso, você pode fazer suas perguntas através do nosso fórum.

Veja também

Info: Você pode estar interessado em outra API Python (Aspose.Slides for Python via NET) que permite converter apresentações em imagens e importar imagens em apresentações.