Convertir des documents Word en EPUB en Python

EPUB est un format populaire utilisé pour les publications électroniques appelées ebooks. Les fichiers EPUB peuvent être lus sur des smartphones, des tablettes, des ordinateurs portables, etc. Dans divers cas, les fichiers MS Word sont convertis en EPUB pour rendre le document disponible sur plusieurs plateformes de lecture. Pour accomplir cette conversion par programmation, cet article explique comment convertir des fichiers Word DOCX ou DOC en EPUB à l’aide de Python.

Bibliothèque Python pour la conversion de Word en EPUB

Afin de convertir les fichiers DOCX ou DOC au format EPUB, nous utiliserons Aspose.Words for Python. Ladite bibliothèque fournit un large éventail de fonctionnalités pour créer et manipuler des documents Word. De plus, il vous permet de convertir des documents Word vers d’autres formats avec une haute fidélité. Aspose.Words for Python peut être installé à partir de PyPI à l’aide de la commande pip suivante.

pip install aspose-words 

Convertir un document Word en EPUB en Python

Voici les étapes pour convertir un document Word en EPUB en Python.

  • Chargez le document Word à l’aide de la classe Document.
  • Convertissez Word en EPUB en utilisant la méthode Document.save(string).

L’exemple de code suivant montre comment convertir un fichier DOCX en EPUB en Python.

import aspose.words as aw

# Load the Word document
doc = aw.Document("document.docx")

# Convert Word document to EPUB
doc.save("word-to-epub.epub")

Options supplémentaires pour Word vers EPUB en Python

Aspose.Words for Python fournit également des options supplémentaires pour personnaliser la conversion de Word en EPUB. Par exemple, vous pouvez définir un schéma de codage, activer ou désactiver l’exportation des informations du document, etc. Pour spécifier ces options, la classe HtmlSaveOptions est utilisée. Voici les étapes pour définir ces options dans la conversion Word vers EPUB.

  • Tout d’abord, chargez le document Word à l’aide de la classe Document.
  • Créez une instance de la classe HtmlSaveOptions.
  • Définissez les options souhaitées à l’aide de l’objet HtmlSaveOptions.
  • Enfin, convertissez Word en EPUB à l’aide de la méthode Document.save(string, HtmlSaveOptions).

L’exemple de code suivant montre comment spécifier des options supplémentaires dans la conversion Word vers EPUB.

import aspose.words as aw

# Load the Word document
doc = aw.Document("document.docx")

# Create an object for save options
saveOptions = aw.saving.HtmlSaveOptions()

# Set the desired encoding
saveOptions.encoding = "utf-8"

# Specify at what elements to split the internal HTML at. This creates a new HTML within the EPUB 
# which allows you to limit the size of each HTML part. This is useful for readers which cannot read 
# HTML files greater than a certain size e.g 300kb.
saveOptions.document_split_criteria = aw.saving.DocumentSplitCriteria.HEADING_PARAGRAPH

# Enable export of document properties
saveOptions.export_document_properties = True

# Specify save format
saveOptions.save_format = aw.SaveFormat.EPUB

# Convert Word document to EPUB
doc.save("word-to-epub.epub", saveOptions)

Obtenez une licence gratuite

Vous pouvez obtenir une licence temporaire pour utiliser Aspose.Words for Python sans limitation d’évaluation.

Conclusion

Dans cet article, vous avez appris à convertir des documents Word au format EPUB en Python. De plus, vous avez vu comment utiliser différentes options pour personnaliser dynamiquement la conversion de Word en EPUB. En plus de cela, vous pouvez explorer la documentation de Aspose.Words for Python. Si vous avez des questions, n’hésitez pas à nous en faire part via notre forum.

Voir également