HTML para texto Java

As páginas HTML são amplamente utilizadas na Internet. Eles podem conter imagens, desenhos e texto para apresentar informações. Às vezes, pode ser necessário converter um arquivo HTML para o formato de texto. Assim, este artigo aborda como converter HTML em Texto programaticamente em Java.

Conversor de HTML para Texto – Instalação da API Java

Aspose.HTML for Java API suporta HTML, MHTML, Text e muitos outros formatos de arquivo. Você pode configurar rapidamente a API baixando seu arquivo JAR da seção New Releases, ou através das seguintes configurações para acessá-la no Aspose Repository:

Repositório:

 <repositories>
     <repository>
         <id>snapshots</id>
         <name>repo</name>
         <url>http://repository.aspose.com/repo/</url>
     </repository>
</repositories>

Dependência:

 <dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-html</artifactId>
        <version>22.7</version>
        <classifier>jdk17</classifier>
    </dependency>
</dependencies>

Converter HTML em texto programaticamente em Java

As etapas a seguir mostram como converter HTML em texto programaticamente em Java:

  1. Carregue o arquivo HTML de entrada com a classe HTMLDocument.
  2. Crie um objeto da classe TextSaveOptions.
  3. Converta o HTML em um arquivo de texto.

O código de exemplo a seguir mostra como converter HTML em texto programaticamente em Java:

// Prepare um código HTML e salve-o no arquivo
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
    fileWriter.write(code);
}

// Inicializar um documento HTML do arquivo
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
    // Inicialize o objeto da classe TextSaveOptions
    com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
    
    // Converter HTML em texto
    com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
    if (document != null) {
        document.dispose();
    }
}

Explore o Aspose.HTML para Java

Você pode explorar muitos outros recursos da API visitando o espaço documentação. Ele contém diferentes seções e capítulos para explicar os métodos e propriedades expostos por diferentes classes da API.

Conclusão

Concluindo, você explorou como converter HTML em texto programaticamente em Java. Pode ser útil exportar a cadeia de texto da página HTML para o formato de texto simples. Além disso, sinta-se à vontade para entrar em contato conosco através do fórum em caso de dúvidas.

Veja também