Convertir Word a JSON en Python

En varios casos, debe realizar la conversión de Word a JSON mediante programación desde su aplicación de Python. Por ejemplo, para exportar los datos de un documento de Word y procesarlos o transportarlos en formato JSON. En este artículo, aprenderá cómo convertir fácilmente el texto de un documento de Word al formato JSON. Además, aprenderá cómo cargar un documento de Word protegido y convertirlo a JSON mediante programación. Así que procedamos a convertir Word a JSON en Python.

Cómo convertir Word a JSON en Python

Para convertir un documento de Word a formato JSON, realizaremos los siguientes pasos:

  • Cargue el documento de Word.
  • Conviértelo a formato HTML.
  • Guarde el archivo HTML en formato JSON.

Veamos cómo implementar estos pasos mediante programación en Python. Para ello, primero instalaremos un par de bibliotecas, como se demuestra en la siguiente sección.

Bibliotecas de Python para convertir Word a JSON - Descarga gratuita

Aspose.Words for Python es una poderosa biblioteca diseñada para crear y procesar documentos de MS Word. Usaremos esta biblioteca para exportar el contenido de un documento de Word a HTML. Una vez que tengamos el contenido HTML, usaremos Aspose.Cells for Python para guardarlo como un archivo JSON.

Puede usar los siguientes comandos pip para instalar ambas bibliotecas.

pip install aspose-cells
pip install aspose-words

Convertir Word a JSON en Python

Los siguientes son los pasos para convertir Word a JSON en Python.

  • Cargue el documento de Word utilizando la clase Document de Aspose.Words.
  • Guarde el documento de Word como HTML usando el método Document.save().
  • Cargue el archivo HTML utilizando la clase Workbook de Aspose.Cells.
  • Convierta el documento al formato JSON usando el método Workbook.save().

El siguiente ejemplo de código muestra cómo convertir un documento de Word a JSON en Python.

# Cargar documento
doc = aw.Document("document1.docx")

# Guardar documento en formato HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Cargue el archivo HTML en una instancia de la clase Workbook
book = Workbook("html_output.html")

# Guardar como JSON
book.save("word-to-json.json", SaveFormat.JSON)

Convierta Word protegido a JSON en Python

También puede cargar los documentos de Word protegidos con sus contraseñas y convertirlos al formato JSON. Los siguientes son los pasos para convertir un documento de Word protegido a JSON en Python.

  • Cargue el documento de Word utilizando la clase Document de Aspose.Words.
  • Use la clase LoadOptions de Aspose.Words para especificar la contraseña del documento de Word protegido.
  • Guarde el documento de Word como HTML usando el método Document.save().
  • Cargue el archivo HTML utilizando la clase Workbook de Aspose.Cells.
  • Convierta el documento al formato JSON usando el método Workbook.save().

El siguiente ejemplo de código muestra cómo convertir un documento de Word protegido a JSON en Python.

# Cargar documento protegido usando LoadOptions
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# Guardar documento en formato HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Cargue el archivo HTML en una instancia de la clase Workbook
book = Workbook("html_output.html")

# Guardar como JSON
book.save("word-to-json.json", SaveFormat.JSON)

Bibliotecas de Python Word to JSON Converter - Obtenga una licencia gratuita

Puede obtener una licencia temporal gratuita para usar las bibliotecas sin limitaciones de evaluación.

Conclusión

En este artículo, ha aprendido cómo convertir Word a JSON en Python. Además, ha visto cómo convertir un documento de Word protegido por contraseña a JSON mediante programación. Además, puede visitar la documentación de Aspose.Words for Python y Aspose.Cells for Python para explorar más sobre las bibliotecas. En caso de que tenga alguna pregunta, no dude en hacérnosla saber a través de nuestro foro.

Ver también