Converter documentos do Word para EPUB em Python

EPUB é um formato popular usado para publicações eletrônicas conhecidas como e-books. Os arquivos EPUB podem ser lidos em smartphones, tablets, laptops, etc. Em vários casos, os arquivos MS Word são convertidos em EPUB para disponibilizar o documento em várias plataformas de leitura. Para realizar essa conversão programaticamente, este artigo aborda como converter arquivos do Word DOCX ou DOC em EPUB usando Python.

Biblioteca Python para conversão de Word para EPUB

Para converter arquivos DOCX ou DOC para o formato EPUB, utilizaremos Aspose.Words for Python. A referida biblioteca fornece uma ampla gama de recursos para criar e manipular documentos do Word. Além disso, permite converter documentos do Word para outros formatos com alta fidelidade. O Aspose.Words for Python pode ser instalado a partir de PyPI usando o seguinte comando pip.

pip install aspose-words 

Converter um documento do Word para EPUB em Python

A seguir estão as etapas para converter um documento do Word em EPUB em Python.

  • Carregue o documento do Word usando a classe Document.
  • Converta Word para EPUB usando o método Document.save(string).

O exemplo de código a seguir mostra como converter um arquivo DOCX em EPUB em Python.

import aspose.words as aw

# Load the Word document
doc = aw.Document("document.docx")

# Convert Word document to EPUB
doc.save("word-to-epub.epub")

Opções adicionais para Word para EPUB em Python

Aspose.Words for Python também oferece opções adicionais para personalizar a conversão de Word para EPUB. Por exemplo, você pode definir um esquema de codificação, ativar ou desativar a exportação de informações do documento e assim por diante. Para especificar essas opções, a classe HtmlSaveOptions é usada. A seguir estão as etapas para definir essas opções na conversão do Word para EPUB.

  • Primeiro, carregue o documento do Word usando a classe Document.
  • Crie uma instância da classe HtmlSaveOptions.
  • Defina as opções desejadas usando o objeto HtmlSaveOptions.
  • Finalmente, converta o Word para EPUB usando o método Document.save(string, HtmlSaveOptions).

O exemplo de código a seguir mostra como especificar opções adicionais na conversão de Word para EPUB.

import aspose.words as aw

# Load the Word document
doc = aw.Document("document.docx")

# Create an object for save options
saveOptions = aw.saving.HtmlSaveOptions()

# Set the desired encoding
saveOptions.encoding = "utf-8"

# Specify at what elements to split the internal HTML at. This creates a new HTML within the EPUB 
# which allows you to limit the size of each HTML part. This is useful for readers which cannot read 
# HTML files greater than a certain size e.g 300kb.
saveOptions.document_split_criteria = aw.saving.DocumentSplitCriteria.HEADING_PARAGRAPH

# Enable export of document properties
saveOptions.export_document_properties = True

# Specify save format
saveOptions.save_format = aw.SaveFormat.EPUB

# Convert Word document to EPUB
doc.save("word-to-epub.epub", saveOptions)

Obtenha uma licença gratuita

Você pode obter uma licença temporária para usar o Aspose.Words for Python sem limitações de avaliação.

Conclusão

Neste artigo, você aprendeu como converter documentos do Word para o formato EPUB em Python. Além disso, você viu como usar diferentes opções para personalizar a conversão de Word para EPUB dinamicamente. Além disso, você pode explorar a documentação do Aspose.Words for Python. Caso você tenha alguma dúvida, sinta-se à vontade para nos informar através do nosso fórum.

Veja também