HTML na text Java

Stránky HTML jsou na internetu široce používány. Mohou obsahovat obrázky, kresby a text k prezentaci informací. Někdy může být nutné převést soubor HTML na text. V souladu s tím tento článek popisuje, jak převést HTML na text programově v Javě.

Převodník HTML na TXT – Instalace Java API

Aspose.HTML for Java API podporuje HTML, MHTML, text a mnoho dalších formátů souborů. Rozhraní API můžete rychle nakonfigurovat stažením jeho souboru JAR ze sekce New Releases nebo pomocí následujících konfigurací pro přístup z Aspose Repository:

úložiště:

 <repositories>
   <repository>
     <id>snapshots</id>
     <name>repo</name>
     <url>http://repository.aspose.com/repo/</url>
   </repository>
</repositories>

Závislost:

 <dependencies>
  <dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-html</artifactId>
    <version>22.7</version>
    <classifier>jdk17</classifier>
  </dependency>
</dependencies>

Jak převést HTML na TXT v Javě

Webovou stránku HTML můžete převést na soubor TXT pomocí následujících kroků:

 1. Otevřete zdrojovou webovou stránku HTML.
 2. Zadejte požadované vlastnosti pro převod.
 3. Převeďte soubor HTML do formátu TXT.

Další část dále rozvádí proces konverze.

Převeďte HTML na text programově v Javě

Následující kroky ukazují, jak převést HTML na text programově v Javě:

 1. Načtěte vstupní soubor HTML pomocí třídy HTMLDocument.
 2. Vytvořte objekt třídy TextSaveOptions.
 3. Převeďte HTML na textový soubor.

Následující ukázkový kód ukazuje, jak programově převést HTML na text v Javě:

// Připravte si HTML kód a uložte jej do souboru
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
  fileWriter.write(code);
}

// Inicializujte dokument HTML ze souboru
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
  // Inicializujte objekt třídy TextSaveOptions
  com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
  
  // Převést HTML na text
  com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
  if (document != null) {
    document.dispose();
  }
}

Prozkoumejte Aspose.HTML pro Java

Mnoho dalších funkcí rozhraní API můžete prozkoumat v prostoru dokumentace. Obsahuje různé sekce a kapitoly vysvětlující metody a vlastnosti vystavené různými třídami API.

Závěr

Na závěr jste prozkoumali, jak převést HTML na text programově v Javě. Může být užitečné exportovat textový řetězec z HTML stránky do prostého formátu TXT. Kromě toho nás v případě jakýchkoli obav neváhejte kontaktovat prostřednictvím fóra.

Viz také