Convertir DOCX a JSON en Java

En ciertos casos, debe exportar el contenido de un archivo Word DOCX a JSON mediante programación. Para lograrlo, este artículo proporciona una guía sencilla sobre cómo convertir el texto de un documento DOCX al formato JSON desde sus aplicaciones Java. También aprenderá cómo convertir documentos DOCX protegidos a JSON mediante programación. Así que procedamos a convertir DOCX a JSON en Java.

Cómo convertir DOCX a JSON en Java

Para convertir un documento DOCX a formato JSON, debemos realizar los siguientes pasos:

  • Cargue el documento DOCX.
  • Conviértelo a formato HTML.
  • Guarde el archivo HTML en formato JSON.

Veamos cómo realizar estos pasos mediante programación en Java. Para esto necesitas instalar dos bibliotecas que se mencionan en la siguiente sección.

Bibliotecas Java para Convertir DOCX a JSON - Descarga Gratuita

Aspose.Words for Java es una poderosa biblioteca que le permite crear y procesar documentos de MS Word. Usaremos esta biblioteca para exportar el contenido de un archivo DOCX a HTML. Luego, usaremos Aspose.Cells for Java para guardar el contenido HTML como un archivo JSON. Puede descargar los archivos JAR de ambas bibliotecas o instalarlos utilizando las configuraciones de Maven.

Descargar JAR

Instalar a través de Maven

<dependencies>
	<dependency>
		<groupId>com.aspose</groupId>
		<artifactId>aspose-words</artifactId>
		<version>22.7</version>
		<classifier>jdk17</classifier>
	</dependency>
	<dependency>
		<groupId>com.aspose</groupId>
		<artifactId>aspose-cells</artifactId>
		<version>22.7</version>
	</dependency>
</dependencies>
<repositories>
	<repository>
		<id>AsposeJavaAPI</id>
		<name>Aspose Java API</name>
		<url>https://repository.aspose.com/repo/</url>
	</repository>
</repositories>

Convertir DOCX a JSON en Java

Los siguientes son los pasos para convertir DOCX a JSON en Java.

El siguiente ejemplo de código muestra cómo convertir un documento DOCX a JSON en Java.

// Cargue un documento de Word usando Aspose.Words
Document doc = new Document("sample1.docx");

// Guardar como HTML
doc.save("html_output.html", SaveFormat.HTML);

// Cargue el archivo HTML guardado usando Aspose.Cells
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");

// Guardar HTML como JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);

Java Convertir DOCX protegido a JSON

También puede cargar los documentos DOCX protegidos utilizando sus contraseñas y convertirlos al formato JSON. Los siguientes son los pasos para convertir un documento DOCX protegido a JSON en Java.

El siguiente ejemplo de código muestra cómo convertir un documento DOCX protegido a JSON en Java.

// Cargue un documento de Word usando Aspose.Words
Document doc = new Document("sample1.docx", new com.aspose.words.LoadOptions("MyPassword"));

// Guardar como HTML
doc.save("html_output.html", SaveFormat.HTML);

// Cargue el archivo HTML guardado usando Aspose.Cells
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");

// Guardar HTML como JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);

Bibliotecas de conversión de DOCX a JSON de Java: obtenga una licencia gratuita

Puede obtener una licencia temporal gratuita para usar las bibliotecas sin limitaciones de evaluación.

Conclusión

En este artículo, ha aprendido cómo convertir DOCX a JSON en Java. Además, ha visto cómo convertir un documento DOCX protegido con contraseña a JSON mediante programación. Además, puede visitar la documentación de Aspose.Words for Java y Aspose.Cells for Java para explorar otras funciones. En caso de que tenga alguna pregunta, no dude en hacérnosla saber a través de nuestro foro.

Ver también