Las páginas HTML son ampliamente utilizadas en Internet. Pueden contener imágenes, dibujos y texto para presentar información. A veces, es posible que necesite convertir un archivo HTML a formato de texto. En consecuencia, este artículo cubre cómo convertir HTML a Texto mediante programación en Java.
- Convertidor de HTML a texto: instalación de la API de Java
- Convierta HTML a texto mediante programación en Java
Convertidor de HTML a texto: instalación de la API de Java
Aspose.HTML para Java La API es compatible con HTML, MHTML, texto y muchos otros formatos de archivo. Puede configurar rápidamente la API descargando su archivo JAR desde la sección Nuevos lanzamientos, o a través de las siguientes configuraciones para acceder desde el Repositorio de Aspose:
Repositorio:
<repositories>
<repository>
<id>snapshots</id>
<name>repo</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Dependencia:
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-html</artifactId>
<version>22.7</version>
<classifier>jdk17</classifier>
</dependency>
</dependencies>
Convierta HTML a texto mediante programación en Java
Los siguientes pasos muestran cómo convertir HTML a texto mediante programación en Java:
- Cargue el archivo HTML de entrada con la clase HTMLDocument.
- Cree un objeto de la clase TextSaveOptions.
- Convierta el HTML en un archivo de texto.
El siguiente código de ejemplo muestra cómo convertir HTML a texto mediante programación en Java:
// Prepare un código HTML y guárdelo en el archivo
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
fileWriter.write(code);
}
// Inicializar un documento HTML desde el archivo
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
// Inicializar objeto de clase TextSaveOptions
com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
// Convertir HTML a texto
com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
if (document != null) {
document.dispose();
}
}
Explore Aspose.HTML para Java
Puede explorar muchas otras características de la API visitando el espacio documentación. Contiene diferentes secciones y capítulos para explicar los métodos y propiedades expuestas por diferentes clases de la API.
Conclusión
En conclusión, ha explorado cómo convertir HTML a texto mediante programación en Java. Puede resultar útil exportar la cadena de texto de la página HTML a formato de texto sin formato. Además, no dude en ponerse en contacto con nosotros a través del foro en caso de que tenga alguna inquietud.