HTML a texto Java

Las páginas HTML son ampliamente utilizadas en Internet. Pueden contener imágenes, dibujos y texto para presentar información. A veces, es posible que necesite convertir un archivo HTML a formato de texto. En consecuencia, este artículo cubre cómo convertir HTML a Texto mediante programación en Java.

Convertidor de HTML a texto: instalación de la API de Java

Aspose.HTML para Java La API es compatible con HTML, MHTML, texto y muchos otros formatos de archivo. Puede configurar rápidamente la API descargando su archivo JAR desde la sección Nuevos lanzamientos, o a través de las siguientes configuraciones para acceder desde el Repositorio de Aspose:

Repositorio:

 <repositories>
     <repository>
         <id>snapshots</id>
         <name>repo</name>
         <url>http://repository.aspose.com/repo/</url>
     </repository>
</repositories>

Dependencia:

 <dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-html</artifactId>
        <version>22.7</version>
        <classifier>jdk17</classifier>
    </dependency>
</dependencies>

Convierta HTML a texto mediante programación en Java

Los siguientes pasos muestran cómo convertir HTML a texto mediante programación en Java:

  1. Cargue el archivo HTML de entrada con la clase HTMLDocument.
  2. Cree un objeto de la clase TextSaveOptions.
  3. Convierta el HTML en un archivo de texto.

El siguiente código de ejemplo muestra cómo convertir HTML a texto mediante programación en Java:

// Prepare un código HTML y guárdelo en el archivo
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
    fileWriter.write(code);
}

// Inicializar un documento HTML desde el archivo
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
    // Inicializar objeto de clase TextSaveOptions
    com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
    
    // Convertir HTML a texto
    com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
    if (document != null) {
        document.dispose();
    }
}

Explore Aspose.HTML para Java

Puede explorar muchas otras características de la API visitando el espacio documentación. Contiene diferentes secciones y capítulos para explicar los métodos y propiedades expuestas por diferentes clases de la API.

Conclusión

En conclusión, ha explorado cómo convertir HTML a texto mediante programación en Java. Puede resultar útil exportar la cadena de texto de la página HTML a formato de texto sin formato. Además, no dude en ponerse en contacto con nosotros a través del foro en caso de que tenga alguna inquietud.

Ver también