As páginas HTML são amplamente utilizadas na Internet. Eles podem conter imagens, desenhos e texto para apresentar informações. Às vezes, pode ser necessário converter um arquivo HTML para o formato de texto. Assim, este artigo aborda como converter HTML em Texto programaticamente em Java.
- Conversor de HTML para Texto – Instalação da API Java
- Converter HTML em texto programaticamente em Java
Conversor de HTML para Texto – Instalação da API Java
Aspose.HTML for Java API suporta HTML, MHTML, Text e muitos outros formatos de arquivo. Você pode configurar rapidamente a API baixando seu arquivo JAR da seção New Releases, ou através das seguintes configurações para acessá-la no Aspose Repository:
Repositório:
<repositories>
<repository>
<id>snapshots</id>
<name>repo</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Dependência:
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-html</artifactId>
<version>22.7</version>
<classifier>jdk17</classifier>
</dependency>
</dependencies>
Converter HTML em texto programaticamente em Java
As etapas a seguir mostram como converter HTML em texto programaticamente em Java:
- Carregue o arquivo HTML de entrada com a classe HTMLDocument.
- Crie um objeto da classe TextSaveOptions.
- Converta o HTML em um arquivo de texto.
O código de exemplo a seguir mostra como converter HTML em texto programaticamente em Java:
// Prepare um código HTML e salve-o no arquivo
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
fileWriter.write(code);
}
// Inicializar um documento HTML do arquivo
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
// Inicialize o objeto da classe TextSaveOptions
com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
// Converter HTML em texto
com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
if (document != null) {
document.dispose();
}
}
Explore o Aspose.HTML para Java
Você pode explorar muitos outros recursos da API visitando o espaço documentação. Ele contém diferentes seções e capítulos para explicar os métodos e propriedades expostos por diferentes classes da API.
Conclusão
Concluindo, você explorou como converter HTML em texto programaticamente em Java. Pode ser útil exportar a cadeia de texto da página HTML para o formato de texto simples. Além disso, sinta-se à vontade para entrar em contato conosco através do fórum em caso de dúvidas.