Страницы HTML широко используются в Интернете. Они могут содержать изображения, рисунки и текст для представления информации. Иногда вам может понадобиться преобразовать файл HTML в текстовый формат. Соответственно, в этой статье рассказывается, как программно преобразовать HTML в Text в Java.
Конвертер HTML в текст — установка Java API
Aspose.HTML для Java API поддерживает HTML, MHTML, текст и многие другие форматы файлов. Вы можете быстро настроить API, загрузив его JAR-файл из раздела Новые выпуски или выполнив следующие настройки для доступа к нему из Репозитория Aspose:
Репозиторий:
<repositories>
<repository>
<id>snapshots</id>
<name>repo</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Зависимость:
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-html</artifactId>
<version>22.7</version>
<classifier>jdk17</classifier>
</dependency>
</dependencies>
Программное преобразование HTML в текст в Java
Следующие шаги показывают, как программно преобразовать HTML в текст в Java:
- Загрузите входной файл HTML с классом HTMLDocument.
- Создайте объект класса TextSaveOptions.
- Преобразуйте HTML в текстовый файл.
В следующем примере кода показано, как программно преобразовать HTML в текст в Java:
// Подготовьте HTML-код и сохраните его в файл
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
fileWriter.write(code);
}
// Инициализировать документ HTML из файла
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
// Инициализировать объект класса TextSaveOptions
com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
// Преобразование HTML в текст
com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
if (document != null) {
document.dispose();
}
}
Изучите Aspose.HTML для Java
Вы можете изучить многие другие функции API, посетив раздел документация. Он содержит различные разделы и главы для объяснения методов и свойств, предоставляемых различными классами API.
Вывод
В заключение вы узнали, как программно преобразовать HTML в текст в Java. Может быть полезно экспортировать текстовую строку со страницы HTML в обычный текстовый формат. Кроме того, пожалуйста, не стесняйтесь обращаться к нам через форум в случае каких-либо проблем.