HTML в текстовий Java

Сторінки HTML широко використовуються в Інтернеті. Вони можуть містити зображення, малюнки та текст для представлення інформації. Іноді вам може знадобитися перетворити файл HTML на текстовий. Відповідно, у цій статті розповідається про те, як програмно перетворити HTML на text у Java.

Конвертер HTML у TXT – встановлення Java API

Aspose.HTML for Java API підтримує HTML, MHTML, Text і багато інших форматів файлів. Ви можете швидко налаштувати API, завантаживши його JAR-файл із розділу Нові випуски або скориставшись наведеними нижче налаштуваннями для доступу до нього з Aspose Repository:

Репозиторій:

 <repositories>
     <repository>
         <id>snapshots</id>
         <name>repo</name>
         <url>http://repository.aspose.com/repo/</url>
     </repository>
</repositories>

Залежність:

 <dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-html</artifactId>
        <version>22.7</version>
        <classifier>jdk17</classifier>
    </dependency>
</dependencies>

Як конвертувати HTML у TXT у Java

Ви можете перетворити веб-сторінку HTML у файл TXT, виконавши такі дії:

  1. Доступ до веб-сторінки вихідного HTML.
  2. Вкажіть необхідні властивості для перетворення.
  3. Перетворення файлу HTML у формат TXT.

У наступному розділі докладніше розповідається про процес перетворення.

Перетворення HTML на текст програмним шляхом у Java

Наступні кроки показують, як програмно перетворити HTML на текст у Java:

  1. Завантажте вхідний файл HTML за допомогою класу HTMLDocument.
  2. Створіть об’єкт класу TextSaveOptions.
  3. Перетворіть HTML на текстовий файл.

У наведеному нижче прикладі коду показано, як програмно перетворити HTML на текст у Java:

// Підготуйте HTML-код і збережіть його у файлі
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
    fileWriter.write(code);
}

// Ініціалізація HTML-документа з файлу
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
    // Ініціалізувати об’єкт класу TextSaveOptions
    com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
    
    // Перетворення HTML на текст
    com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
    if (document != null) {
        document.dispose();
    }
}

Дослідіть Aspose.HTML for Java

Ви можете дослідити багато інших функцій API, відвідавши розділ документація. Він містить різні розділи та глави для пояснення методів і властивостей, наданих різними класами API.

Висновок

На завершення ви дослідили, як програмно перетворити HTML на текст у Java. Може бути корисним експортувати текстовий рядок зі сторінки HTML у звичайний формат TXT. Крім того, у разі будь-яких проблем зв’яжіться з нами через форум.

Дивись також