HTML 頁面在互聯網上被廣泛使用。它們可能包含圖像、繪圖和文本來呈現信息。有時,您可能需要將 HTML 文件轉換為文本。因此,本文介紹瞭如何在 Java 中以編程方式將 HTML 轉換為 text。
HTML 到文本轉換器 – Java API 安裝
Aspose.HTML for Java API 支持 HTML、MHTML、文本和許多其他文件格式。您可以通過從 New Releases 部分下載其 JAR 文件來快速配置 API,或者通過以下配置從 Aspose Repository 訪問它:
存儲庫:
<repositories>
<repository>
<id>snapshots</id>
<name>repo</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
依賴:
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-html</artifactId>
<version>22.7</version>
<classifier>jdk17</classifier>
</dependency>
</dependencies>
在 Java 中以編程方式將 HTML 轉換為文本
以下步驟顯示瞭如何在 Java 中以編程方式將 HTML 轉換為文本:
- 使用 HTMLDocument 類加載輸入 HTML 文件。
- 創建 TextSaveOptions 類的對象。
- 將 HTML 轉換為文本文件。
以下示例代碼顯示瞭如何在 Java 中以編程方式將 HTML 轉換為文本:
// 準備一段HTML代碼並保存到文件中
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
fileWriter.write(code);
}
// 從文件初始化 HTML 文檔
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
// 初始化 TextSaveOptions 類對象
com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
// 將 HTML 轉換為文本
com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
if (document != null) {
document.dispose();
}
}
探索 Aspose.HTML for Java
您可以通過訪問 文檔 空間來探索 API 的許多其他功能。它包含不同的部分和章節來解釋不同 API 類公開的方法和屬性。
結論
總之,您已經探索瞭如何在 Java 中以編程方式將 HTML 轉換為文本。將文本字符串從 HTML 頁面導出為純文本格式可能很有用。此外,如有任何疑慮,請隨時通過 論壇 與我們聯繫。