HTML till text Java

HTML-sidor används ofta över internet. De kan innehålla bilder, ritningar och text för att presentera information. Ibland kan du behöva konvertera en HTML-fil till text. Följaktligen täcker den här artikeln hur man konverterar HTML till text programmatiskt i Java.

HTML till TXT Converter – Java API-installation

Aspose.HTML for Java API stöder HTML, MHTML, Text och många andra filformat. Du kan snabbt konfigurera API:et genom att ladda ner dess JAR-fil från avsnittet New Releases eller via följande konfigurationer för att komma åt det från Aspose Repository:

Förvar:

 <repositories>
     <repository>
         <id>snapshots</id>
         <name>repo</name>
         <url>http://repository.aspose.com/repo/</url>
     </repository>
</repositories>

Beroende:

 <dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-html</artifactId>
        <version>22.7</version>
        <classifier>jdk17</classifier>
    </dependency>
</dependencies>

Hur man konverterar HTML till TXT i Java

Du kan konvertera en HTML-webbsida till en TXT-fil med följande steg:

  1. Gå till HTML-källans webbsida.
  2. Ange de egenskaper som krävs för konvertering.
  3. Konvertera HTML-fil till TXT-format.

Nästa avsnitt utvecklar omvandlingsprocessen ytterligare.

Konvertera HTML till text Programmatiskt i Java

Följande steg visar hur du konverterar HTML till text programmatiskt i Java:

  1. Ladda in HTML-filen med klassen HTMLDocument.
  2. Skapa ett objekt av klassen TextSaveOptions.
  3. Konvertera HTML till en textfil.

Följande exempelkod visar hur man konverterar HTML till text programmatiskt i Java:

// Förbered en HTML-kod och spara den i filen
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
    fileWriter.write(code);
}

// Initiera ett HTML-dokument från filen
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
    // Initiera TextSaveOptions-klassobjektet
    com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
    
    // Konvertera HTML till text
    com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
    if (document != null) {
        document.dispose();
    }
}

Utforska Aspose.HTML för Java

Du kan utforska många andra funktioner i API:t genom att besöka utrymmet dokumentation. Den innehåller olika avsnitt och kapitel för att förklara metoderna och egenskaperna som exponeras av olika klasser av API.

Slutsats

Sammanfattningsvis har du utforskat hur man konverterar HTML till text programmatiskt i Java. Det kan vara användbart att exportera textsträngen från HTML-sidan till vanligt TXT-format. Dessutom är du välkommen att kontakta oss via forum om du har några problem.

Se även