Convierta archivos HTML a Word DOCX DOC en Java

En varios casos, es posible que deba convertir el contenido HTML en un documento de Word. Por ejemplo, para generar el documento desde un editor HTML WYSIWYG o convertir una página web a formato DOCX o DOC. Para realizar esta conversión mediante programación, este artículo explica cómo convertir archivos HTML a Word DOCX, DOC, DOCM u otros formatos en Java.

Biblioteca Java para convertir HTML a Word

Para convertir HTML a DOCX, DOC, DOT, DOCM y otros formatos de Word, usaremos Aspose.Words for Java. Es una poderosa biblioteca para crear y manipular documentos de Word mediante programación. Además, proporciona un convertidor de documentos incorporado que proporciona una conversión de alta fidelidad de/a documentos de procesamiento de Word. Puede descargar el JAR de la API desde la sección de descargas o instalarlo usando las siguientes configuraciones de Maven en pom.xml.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Convertir HTML a DOCX/DOC/DOCM en Java

Con Aspose.Words for Java, la conversión de un archivo HTML a formato Word se puede realizar en un par de pasos, que se mencionan a continuación.

La enumeración SaveFormat en el método Document.save() especifica el formato en el que desea convertir el archivo HTML. El siguiente ejemplo de código muestra cómo generar un documento de Word desde HTML en Java.

// Cargue el archivo HTML usando la clase de documento
Document document = new Document("template.html");

// Convertir archivo HTML a formato Word DOCX
document.save("output.docx", SaveFormat.DOCX); 

Convierta una página web a Word usando URL en Java

También puede convertir una página web en un documento de Word directamente desde su URL. Los siguientes son los pasos para convertir HTML a DOCX usando URL en Java.

  • Cree una instancia de la clase URL e inicialícela con la URL deseada.
  • Abra la URL en un objeto InputStream.
  • Cree una instancia de la clase HtmlLoadOptions.
  • Cree una instancia de la clase Document e inicialícela con los objetos InputStream y HtmlLoadOptions.
  • Guarde la página web como documento de Word utilizando el método Document.save(string, SaveFormat).

El siguiente ejemplo de código muestra cómo convertir una página web en un documento de Word usando una URL.

// Crear e inicializar URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// Obtener página web como flujo de entrada
InputStream is = oracleURL.openStream();

// Inicializar las opciones de carga de HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// Cargar secuencia en el objeto Documento
Document doc = new Document(is, htmloptions);

// Guardar como DOCX
doc.save("output.docx", SaveFormat.DOCX);

Convierta una cadena HTML a Word usando Java

Aspose.Words for Java también le permite generar un documento de Word a partir de una cadena HTML de forma dinámica. Los siguientes son los pasos para realizar esta operación.

El siguiente ejemplo de código muestra cómo convertir una cadena HTML en un archivo DOCX usando Java.

// Crear un nuevo documento
Document doc = new Document();

// Crear un generador de documentos
DocumentBuilder builder = new DocumentBuilder(doc);

// Insertar HTML
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// Guardar como DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);

Obtenga una licencia de API gratuita

Puede usar Aspose.Words for Java sin limitaciones de evaluación al obtener una licencia temporal gratuita.

Conclusión

En este artículo, aprendió cómo convertir archivos HTML a Word DOCX, DOC, DOCM u otros formatos mediante programación usando Java. Además, ha visto cómo convertir una cadena HTML o una página web de una URL a un documento de Word de forma dinámica. Simplemente puede instalar Aspose.Words for Java y usar el código provisto para construir su convertidor de HTML a Word. Además, puede visitar la documentación para explorar más sobre Aspose.Words for Java. Además, puede compartir sus consultas con nosotros en nuestro foro.

Ver también

Información: Si alguna vez necesita obtener un documento de Word de una presentación de PowerPoint, puede usar el convertidor Aspose Presentación a documento de Word.