HTML в текст Java

Страницы HTML широко используются в Интернете. Они могут содержать изображения, рисунки и текст для представления информации. Иногда вам может понадобиться преобразовать файл HTML в текстовый формат. Соответственно, в этой статье рассказывается, как программно преобразовать HTML в Text в Java.

Конвертер HTML в текст — установка Java API

Aspose.HTML для Java API поддерживает HTML, MHTML, текст и многие другие форматы файлов. Вы можете быстро настроить API, загрузив его JAR-файл из раздела Новые выпуски или выполнив следующие настройки для доступа к нему из Репозитория Aspose:

Репозиторий:

 <repositories>
     <repository>
         <id>snapshots</id>
         <name>repo</name>
         <url>http://repository.aspose.com/repo/</url>
     </repository>
</repositories>

Зависимость:

 <dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-html</artifactId>
        <version>22.7</version>
        <classifier>jdk17</classifier>
    </dependency>
</dependencies>

Программное преобразование HTML в текст в Java

Следующие шаги показывают, как программно преобразовать HTML в текст в Java:

  1. Загрузите входной файл HTML с классом HTMLDocument.
  2. Создайте объект класса TextSaveOptions.
  3. Преобразуйте HTML в текстовый файл.

В следующем примере кода показано, как программно преобразовать HTML в текст в Java:

// Подготовьте HTML-код и сохраните его в файл
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
    fileWriter.write(code);
}

// Инициализировать документ HTML из файла
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
    // Инициализировать объект класса TextSaveOptions
    com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
    
    // Преобразование HTML в текст
    com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
    if (document != null) {
        document.dispose();
    }
}

Изучите Aspose.HTML для Java

Вы можете изучить многие другие функции API, посетив раздел документация. Он содержит различные разделы и главы для объяснения методов и свойств, предоставляемых различными классами API.

Вывод

В заключение вы узнали, как программно преобразовать HTML в текст в Java. Может быть полезно экспортировать текстовую строку со страницы HTML в обычный текстовый формат. Кроме того, пожалуйста, не стесняйтесь обращаться к нам через форум в случае каких-либо проблем.

Смотрите также