Convertir Word en JSON en Python

Dans divers cas, vous devez effectuer une conversion Word vers JSON par programmation à partir de votre application Python. Par exemple, pour exporter les données d’un document Word et les traiter ou les transporter au format JSON. Dans cet article, vous apprendrez à convertir facilement le texte d’un document Word au format JSON. De plus, vous apprendrez à charger un document Word protégé et à le convertir en JSON par programme. Passons donc à la conversion de Word en JSON en Python.

Comment convertir Word en JSON en Python

Pour convertir un document Word au format JSON, nous allons effectuer les étapes suivantes :

  • Chargez le document Word.
  • Convertissez-le au format HTML.
  • Enregistrez le fichier HTML au format JSON.

Voyons comment implémenter ces étapes par programmation en Python. Pour cela, nous allons d’abord installer quelques bibliothèques, comme illustré dans la section suivante.

Bibliothèques Python pour convertir Word en JSON - Téléchargement gratuit

Aspose.Words for Python est une bibliothèque puissante conçue pour créer et traiter des documents MS Word. Nous allons utiliser cette bibliothèque pour exporter le contenu d’un document Word en HTML. Une fois que nous aurons le contenu HTML, nous utiliserons Aspose.Cells for Python pour l’enregistrer en tant que fichier JSON.

Vous pouvez utiliser les commandes pip suivantes pour installer les deux bibliothèques.

pip install aspose-cells
pip install aspose-words

Convertir Word en JSON en Python

Voici les étapes pour convertir Word en JSON en Python.

  • Chargez le document Word à l’aide de la classe Document de Aspose.Words.
  • Enregistrez le document Word au format HTML à l’aide de la méthode Document.save().
  • Chargez le fichier HTML à l’aide de la classe Workbook de Aspose.Cells.
  • Convertissez le document au format JSON à l’aide de la méthode Workbook.save().

L’exemple de code suivant montre comment convertir un document Word en JSON en Python.

# Charger le document
doc = aw.Document("document1.docx")

# Enregistrer le document au format HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Charger le fichier HTML dans une instance de la classe Workbook
book = Workbook("html_output.html")

# Enregistrer au format JSON
book.save("word-to-json.json", SaveFormat.JSON)

Convertir un mot protégé en JSON en Python

Vous pouvez également charger les documents Word protégés à l’aide de leurs mots de passe et les convertir au format JSON. Voici les étapes pour convertir un document Word protégé en JSON en Python.

  • Chargez le document Word à l’aide de la classe Document de Aspose.Words.
  • Utilisez la classe LoadOptions de Aspose.Words pour spécifier le mot de passe du document Word protégé.
  • Enregistrez le document Word au format HTML à l’aide de la méthode Document.save().
  • Chargez le fichier HTML à l’aide de la classe Workbook de Aspose.Cells.
  • Convertissez le document au format JSON à l’aide de la méthode Workbook.save().

L’exemple de code suivant montre comment convertir un document Word protégé en JSON en Python.

# Charger le document protégé à l'aide de LoadOptions
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# Enregistrer le document au format HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Charger le fichier HTML dans une instance de la classe Workbook
book = Workbook("html_output.html")

# Enregistrer au format JSON
book.save("word-to-json.json", SaveFormat.JSON)

Bibliothèques de conversion Python Word vers JSON - Obtenez une licence gratuite

Vous pouvez obtenir une licence temporaire gratuite pour utiliser les bibliothèques sans limitation d’évaluation.

Conclusion

Dans cet article, vous avez appris à convertir Word en JSON en Python. De plus, vous avez vu comment convertir un document Word protégé par mot de passe en JSON par programmation. En outre, vous pouvez consulter la documentation de Aspose.Words for Python et Aspose.Cells for Python pour en savoir plus sur les bibliothèques. Si vous avez des questions, n’hésitez pas à nous en faire part via notre forum.

Voir également