EPUB é um formato popular usado para publicações eletrônicas conhecidas como e-books. Os arquivos EPUB podem ser lidos em smartphones, tablets, laptops, etc. Em vários casos, os arquivos MS Word são convertidos em EPUB para disponibilizar o documento em várias plataformas de leitura. Para realizar essa conversão programaticamente, este artigo aborda como converter arquivos do Word DOCX ou DOC em EPUB usando Python.
- Biblioteca Python para conversão de Word para EPUB
- Converter um documento do Word para EPUB
- Opções adicionais para conversão de Word para EPUB
Biblioteca Python para conversão de Word para EPUB
Para converter arquivos DOCX ou DOC para o formato EPUB, utilizaremos Aspose.Words for Python. A referida biblioteca fornece uma ampla gama de recursos para criar e manipular documentos do Word. Além disso, permite converter documentos do Word para outros formatos com alta fidelidade. O Aspose.Words for Python pode ser instalado a partir de PyPI usando o seguinte comando pip.
pip install aspose-words
Converter um documento do Word para EPUB em Python
A seguir estão as etapas para converter um documento do Word em EPUB em Python.
- Carregue o documento do Word usando a classe Document.
- Converta Word para EPUB usando o método Document.save(string).
O exemplo de código a seguir mostra como converter um arquivo DOCX em EPUB em Python.
import aspose.words as aw
# Load the Word document
doc = aw.Document("document.docx")
# Convert Word document to EPUB
doc.save("word-to-epub.epub")
Opções adicionais para Word para EPUB em Python
Aspose.Words for Python também oferece opções adicionais para personalizar a conversão de Word para EPUB. Por exemplo, você pode definir um esquema de codificação, ativar ou desativar a exportação de informações do documento e assim por diante. Para especificar essas opções, a classe HtmlSaveOptions é usada. A seguir estão as etapas para definir essas opções na conversão do Word para EPUB.
- Primeiro, carregue o documento do Word usando a classe Document.
- Crie uma instância da classe HtmlSaveOptions.
- Defina as opções desejadas usando o objeto HtmlSaveOptions.
- Finalmente, converta o Word para EPUB usando o método Document.save(string, HtmlSaveOptions).
O exemplo de código a seguir mostra como especificar opções adicionais na conversão de Word para EPUB.
import aspose.words as aw
# Load the Word document
doc = aw.Document("document.docx")
# Create an object for save options
saveOptions = aw.saving.HtmlSaveOptions()
# Set the desired encoding
saveOptions.encoding = "utf-8"
# Specify at what elements to split the internal HTML at. This creates a new HTML within the EPUB
# which allows you to limit the size of each HTML part. This is useful for readers which cannot read
# HTML files greater than a certain size e.g 300kb.
saveOptions.document_split_criteria = aw.saving.DocumentSplitCriteria.HEADING_PARAGRAPH
# Enable export of document properties
saveOptions.export_document_properties = True
# Specify save format
saveOptions.save_format = aw.SaveFormat.EPUB
# Convert Word document to EPUB
doc.save("word-to-epub.epub", saveOptions)
Obtenha uma licença gratuita
Você pode obter uma licença temporária para usar o Aspose.Words for Python sem limitações de avaliação.
Conclusão
Neste artigo, você aprendeu como converter documentos do Word para o formato EPUB em Python. Além disso, você viu como usar diferentes opções para personalizar a conversão de Word para EPUB dinamicamente. Além disso, você pode explorar a documentação do Aspose.Words for Python. Caso você tenha alguma dúvida, sinta-se à vontade para nos informar através do nosso fórum.