HTML en texte Java

Les pages HTML sont largement utilisées sur Internet. Ils peuvent contenir des images, des dessins et du texte pour présenter des informations. Parfois, vous devrez peut-être convertir un fichier HTML au format texte. En conséquence, cet article explique comment convertir HTML en Texte par programmation en Java.

Convertisseur HTML en texte - Installation de l’API Java

Aspose.HTML pour Java L’API prend en charge HTML, MHTML, Texte et de nombreux autres formats de fichiers. Vous pouvez rapidement configurer l’API en téléchargeant son fichier JAR depuis la section New Releases, ou via les configurations suivantes pour y accéder depuis le Aspose Repository :

Dépôt:

 <repositories>
     <repository>
         <id>snapshots</id>
         <name>repo</name>
         <url>http://repository.aspose.com/repo/</url>
     </repository>
</repositories>

Dépendance:

 <dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-html</artifactId>
        <version>22.7</version>
        <classifier>jdk17</classifier>
    </dependency>
</dependencies>

Convertir HTML en texte par programmation en Java

Les étapes suivantes montrent comment convertir HTML en texte par programmation en Java :

  1. Chargez le fichier HTML d’entrée avec la classe HTMLDocument.
  2. Créez un objet de la classe TextSaveOptions.
  3. Convertissez le HTML en un fichier texte.

L’exemple de code suivant montre comment convertir HTML en texte par programmation en Java :

// Préparez un code HTML et enregistrez-le dans le fichier
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
    fileWriter.write(code);
}

// Initialiser un document HTML à partir du fichier
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
    // Initialiser l'objet de classe TextSaveOptions
    com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
    
    // Convertir HTML en texte
    com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
    if (document != null) {
        document.dispose();
    }
}

Explorer Aspose.HTML pour Java

Vous pouvez explorer de nombreuses autres fonctionnalités de l’API en visitant l’espace documentation. Il contient différentes sections et chapitres pour expliquer les méthodes et les propriétés exposées par différentes classes de l’API.

Conclusion

En conclusion, vous avez exploré comment convertir HTML en texte par programmation en Java. Il peut être utile d’exporter la chaîne de texte de la page HTML au format texte brut. De plus, n’hésitez pas à nous contacter via le forum en cas de problème.

Voir également