HTML zu Text-Java

HTML-Seiten werden im Internet häufig verwendet. Sie können Bilder, Zeichnungen und Text enthalten, um Informationen zu präsentieren. Manchmal müssen Sie möglicherweise eine HTML-Datei in das Textformat konvertieren. Dementsprechend befasst sich dieser Artikel mit der programmgesteuerten Konvertierung von HTML in Text in Java.

HTML to Text Converter – Java-API-Installation

Aspose.HTML für Java API unterstützt HTML, MHTML, Text und viele andere Dateiformate. Sie können die API schnell konfigurieren, indem Sie ihre JAR-Datei aus dem Abschnitt New Releases herunterladen oder über die folgenden Konfigurationen aus dem Aspose Repository darauf zugreifen:

Repository:

 <repositories>
     <repository>
         <id>snapshots</id>
         <name>repo</name>
         <url>http://repository.aspose.com/repo/</url>
     </repository>
</repositories>

Abhängigkeit:

 <dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-html</artifactId>
        <version>22.7</version>
        <classifier>jdk17</classifier>
    </dependency>
</dependencies>

Konvertieren Sie HTML programmgesteuert in Java in Text

Die folgenden Schritte zeigen, wie Sie HTML programmgesteuert in Java in Text konvertieren:

  1. Laden Sie die HTML-Eingabedatei mit der Klasse HTMLDocument.
  2. Erstellen Sie ein Objekt der Klasse TextSaveOptions.
  3. Konvertieren Sie das HTML in eine Textdatei.

Der folgende Beispielcode zeigt, wie HTML in Java programmgesteuert in Text konvertiert wird:

// Bereiten Sie einen HTML-Code vor und speichern Sie ihn in der Datei
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
    fileWriter.write(code);
}

// Initialisieren Sie ein HTML-Dokument aus der Datei
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
    // Objekt der TextSaveOptions-Klasse initialisieren
    com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
    
    // Konvertieren Sie HTML in Text
    com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
    if (document != null) {
        document.dispose();
    }
}

Entdecken Sie Aspose.HTML für Java

Sie können viele weitere Funktionen der API erkunden, indem Sie den Bereich Dokumentation besuchen. Es enthält verschiedene Abschnitte und Kapitel, um die Methoden und Eigenschaften zu erläutern, die von verschiedenen Klassen der API bereitgestellt werden.

Fazit

Abschließend haben Sie untersucht, wie Sie HTML in Java programmgesteuert in Text konvertieren. Es kann nützlich sein, die Textzeichenfolge von der HTML-Seite in das Nur-Text-Format zu exportieren. Außerdem können Sie sich bei Bedenken gerne über das Forum mit uns in Verbindung setzen.

Siehe auch