HTML na text Java

Stránky HTML jsou na internetu široce používány. Mohou obsahovat obrázky, kresby a text k prezentaci informací. Někdy může být nutné převést soubor HTML na text. V souladu s tím tento článek popisuje, jak převést HTML na text programově v Javě.

Převodník HTML na TXT – Instalace Java API

Aspose.HTML for Java API podporuje HTML, MHTML, text a mnoho dalších formátů souborů. Rozhraní API můžete rychle nakonfigurovat stažením jeho souboru JAR ze sekce New Releases nebo pomocí následujících konfigurací pro přístup z Aspose Repository:

úložiště:

 <repositories>
     <repository>
         <id>snapshots</id>
         <name>repo</name>
         <url>http://repository.aspose.com/repo/</url>
     </repository>
</repositories>

Závislost:

 <dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-html</artifactId>
        <version>22.7</version>
        <classifier>jdk17</classifier>
    </dependency>
</dependencies>

Jak převést HTML na TXT v Javě

Webovou stránku HTML můžete převést na soubor TXT pomocí následujících kroků:

  1. Otevřete zdrojovou webovou stránku HTML.
  2. Zadejte požadované vlastnosti pro převod.
  3. Převeďte soubor HTML do formátu TXT.

Další část dále rozvádí proces konverze.

Převeďte HTML na text programově v Javě

Následující kroky ukazují, jak převést HTML na text programově v Javě:

  1. Načtěte vstupní soubor HTML pomocí třídy HTMLDocument.
  2. Vytvořte objekt třídy TextSaveOptions.
  3. Převeďte HTML na textový soubor.

Následující ukázkový kód ukazuje, jak programově převést HTML na text v Javě:

// Připravte si HTML kód a uložte jej do souboru
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
    fileWriter.write(code);
}

// Inicializujte dokument HTML ze souboru
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
    // Inicializujte objekt třídy TextSaveOptions
    com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
    
    // Převést HTML na text
    com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
    if (document != null) {
        document.dispose();
    }
}

Prozkoumejte Aspose.HTML pro Java

Mnoho dalších funkcí rozhraní API můžete prozkoumat v prostoru dokumentace. Obsahuje různé sekce a kapitoly vysvětlující metody a vlastnosti vystavené různými třídami API.

Závěr

Na závěr jste prozkoumali, jak převést HTML na text programově v Javě. Může být užitečné exportovat textový řetězec z HTML stránky do prostého formátu TXT. Kromě toho nás v případě jakýchkoli obav neváhejte kontaktovat prostřednictvím fóra.

Viz také