Сторінки HTML широко використовуються в Інтернеті. Вони можуть містити зображення, малюнки та текст для представлення інформації. Іноді вам може знадобитися перетворити файл HTML на текстовий. Відповідно, у цій статті розповідається про те, як програмно перетворити HTML на text у Java.
- Конвертер HTML у TXT – встановлення Java API
- Як конвертувати HTML у TXT у Java
- Програмне перетворення HTML на текст у Java
Конвертер HTML у TXT – встановлення Java API
Aspose.HTML for Java API підтримує HTML, MHTML, Text і багато інших форматів файлів. Ви можете швидко налаштувати API, завантаживши його JAR-файл із розділу Нові випуски або скориставшись наведеними нижче налаштуваннями для доступу до нього з Aspose Repository:
Репозиторій:
<repositories>
<repository>
<id>snapshots</id>
<name>repo</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Залежність:
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-html</artifactId>
<version>22.7</version>
<classifier>jdk17</classifier>
</dependency>
</dependencies>
Як конвертувати HTML у TXT у Java
Ви можете перетворити веб-сторінку HTML у файл TXT, виконавши такі дії:
- Доступ до веб-сторінки вихідного HTML.
- Вкажіть необхідні властивості для перетворення.
- Перетворення файлу HTML у формат TXT.
У наступному розділі докладніше розповідається про процес перетворення.
Перетворення HTML на текст програмним шляхом у Java
Наступні кроки показують, як програмно перетворити HTML на текст у Java:
- Завантажте вхідний файл HTML за допомогою класу HTMLDocument.
- Створіть об’єкт класу TextSaveOptions.
- Перетворіть HTML на текстовий файл.
У наведеному нижче прикладі коду показано, як програмно перетворити HTML на текст у Java:
// Підготуйте HTML-код і збережіть його у файлі
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
fileWriter.write(code);
}
// Ініціалізація HTML-документа з файлу
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
// Ініціалізувати об’єкт класу TextSaveOptions
com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
// Перетворення HTML на текст
com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
if (document != null) {
document.dispose();
}
}
Дослідіть Aspose.HTML for Java
Ви можете дослідити багато інших функцій API, відвідавши розділ документація. Він містить різні розділи та глави для пояснення методів і властивостей, наданих різними класами API.
Висновок
На завершення ви дослідили, як програмно перетворити HTML на текст у Java. Може бути корисним експортувати текстовий рядок зі сторінки HTML у звичайний формат TXT. Крім того, у разі будь-яких проблем зв’яжіться з нами через форум.