
En varios casos, es posible que deba convertir el contenido HTML en un documento de Word. Por ejemplo, para generar el documento desde un editor HTML WYSIWYG o convertir una página web a formato DOCX o DOC. Para realizar esta conversión mediante programación, este artículo explica cómo convertir archivos HTML a Word DOCX, DOC, DOCM u otros formatos en Java.
- Biblioteca para convertir HTML a Word
- Convierta un archivo HTML a DOCX/DOC/DOCM, etc.
- Convertir una página web a Word usando URL
- Conversión de cadena HTML a palabra
Biblioteca Java para convertir HTML a Word
Para convertir HTML a DOCX, DOC, DOT, DOCM y otros formatos de Word, usaremos Aspose.Words for Java. Es una poderosa biblioteca para crear y manipular documentos de Word mediante programación. Además, proporciona un convertidor de documentos incorporado que proporciona una conversión de alta fidelidad de/a documentos de procesamiento de Word. Puede descargar el JAR de la API desde la sección de descargas o instalarlo usando las siguientes configuraciones de Maven en pom.xml.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Convertir HTML a DOCX/DOC/DOCM en Java
Con Aspose.Words for Java, la conversión de un archivo HTML a formato Word se puede realizar en un par de pasos, que se mencionan a continuación.
- Cargue el archivo HTML usando la clase Document.
- Guarde el archivo HTML como documento de Word usando el método Document.save(string, SaveFormat).
La enumeración SaveFormat en el método Document.save() especifica el formato en el que desea convertir el archivo HTML. El siguiente ejemplo de código muestra cómo generar un documento de Word desde HTML en Java.
// Cargue el archivo HTML usando la clase de documento
Document document = new Document("template.html");
// Convertir archivo HTML a formato Word DOCX
document.save("output.docx", SaveFormat.DOCX);
Convierta una página web a Word usando URL en Java
También puede convertir una página web en un documento de Word directamente desde su URL. Los siguientes son los pasos para convertir HTML a DOCX usando URL en Java.
- Cree una instancia de la clase URL e inicialícela con la URL deseada.
- Abra la URL en un objeto InputStream.
- Cree una instancia de la clase HtmlLoadOptions.
- Cree una instancia de la clase Document e inicialícela con los objetos InputStream y HtmlLoadOptions.
- Guarde la página web como documento de Word utilizando el método Document.save(string, SaveFormat).
El siguiente ejemplo de código muestra cómo convertir una página web en un documento de Word usando una URL.
// Crear e inicializar URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");
// Obtener página web como flujo de entrada
InputStream is = oracleURL.openStream();
// Inicializar las opciones de carga de HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();
// Cargar secuencia en el objeto Documento
Document doc = new Document(is, htmloptions);
// Guardar como DOCX
doc.save("output.docx", SaveFormat.DOCX);
Convierta una cadena HTML a Word usando Java
Aspose.Words for Java también le permite generar un documento de Word a partir de una cadena HTML de forma dinámica. Los siguientes son los pasos para realizar esta operación.
- Cree una instancia de la clase Document.
- Cree una instancia de la clase DocumentBuilder e inicialícela con el objeto Documento.
- Inserte HTML en el documento usando el método DocumentBuilder.InsertHtml(string).
- Guarde el documento de Word usando el método Document.save(string, SaveFormat).
El siguiente ejemplo de código muestra cómo convertir una cadena HTML en un archivo DOCX usando Java.
// Crear un nuevo documento
Document doc = new Document();
// Crear un generador de documentos
DocumentBuilder builder = new DocumentBuilder(doc);
// Insertar HTML
builder.insertHtml("<ul>\r\n" +
"<li>Item1</li>\r\n" +
"<li>Item2</li>\r\n" +
"</ul>");
// Guardar como DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);
Obtenga una licencia de API gratuita
Puede usar Aspose.Words for Java sin limitaciones de evaluación al obtener una licencia temporal gratuita.
Conclusión
En este artículo, aprendió cómo convertir archivos HTML a Word DOCX, DOC, DOCM u otros formatos mediante programación usando Java. Además, ha visto cómo convertir una cadena HTML o una página web de una URL a un documento de Word de forma dinámica. Simplemente puede instalar Aspose.Words for Java y usar el código provisto para construir su convertidor de HTML a Word. Además, puede visitar la documentación para explorar más sobre Aspose.Words for Java. Además, puede compartir sus consultas con nosotros en nuestro foro.
Ver también
- Cree documentos de Word sin MS Office usando Java
- Convertir PDF a Word en Java
- Convertir Word a PDF en Java
Información: Si alguna vez necesita obtener un documento de Word de una presentación de PowerPoint, puede usar el convertidor Aspose Presentación a documento de Word.