Word a HTML Java

Para incrustar el contenido de los documentos de Word en sus aplicaciones, es posible que deba realizar la conversión. Las conversiones más elegidas en tales casos son Word a HTML o Word a imagen. De acuerdo con eso, este artículo cubre cómo convertir archivos de Word DOCX o DOC a HTML usando Java. Además, discutiremos cómo mantener los archivos de recursos en una carpeta separada.

API de Java para la conversión de Word a HTML

Para la conversión de DOCX/DOC a HTML, usaremos Aspose.Words for Java. Es una potente API para implementar funciones de procesamiento de texto desde las aplicaciones Java. Además, la API proporciona conversión de alta fidelidad de documentos de Word a HTML y otros formatos. Puede descargar la API o instalarla desde Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.10</version>
    <type>pom</type>
</dependency>

Convertir un documento de Word a HTML en Java

Para convertir un documento de Word a HTML, solo necesita cargar el documento y guardarlo como un archivo HTML. Los siguientes son los pasos para convertir un archivo DOCX de Word a HTML usando Java.

El siguiente ejemplo de código muestra cómo convertir un documento de Word a HTML usando Java.

// Cargue el documento desde el disco
Document doc = new Document("document.docx");

// Guardar el documento como HTML
doc.save("Document_out.html", SaveFormat.HTML);

Especifique la carpeta de recursos en la conversión de Word a HTML

También puede configurar la API para guardar los archivos de recursos en una carpeta separada. Además, puede guardar fuentes e imágenes por separado en diferentes carpetas. Los siguientes son los pasos para especificar la carpeta de recursos.

El siguiente ejemplo de código mantiene los archivos de recursos en una carpeta separada en la conversión de Word a HTML.

// Cargar documento
Document doc = new Document("Document.docx");

// Especificar carpeta de recursos
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");

// Convertir documento de Word a HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);

Puede leer más sobre cómo trabajar con carpetas de recursos en la conversión de Word a HTML.

Obtenga una licencia de API gratuita

Puede usar Aspose.Words for Java sin limitaciones de evaluación al obtener una licencia temporal gratuita.

Conclusión

En este artículo, aprendió cómo convertir archivos DOCX o DOC de Word a HTML mediante programación usando Java. Además de esto, ha visto cómo almacenar archivos de recursos por separado en la conversión de Word a HTML. Además, puede leer más sobre Aspose.Words for Java utilizando la documentación. Además, puede compartir sus consultas con nosotros en nuestro foro.

Ver también