HTML 到文本 Java

HTML 頁面在互聯網上被廣泛使用。它們可能包含圖像、繪圖和文本來呈現信息。有時,您可能需要將 HTML 文件轉換為文本。因此,本文介紹瞭如何在 Java 中以編程方式將 HTML 轉換為 text

HTML 到文本轉換器 – Java API 安裝

Aspose.HTML for Java API 支持 HTML、MHTML、文本和許多其他文件格式。您可以通過從 New Releases 部分下載其 JAR 文件來快速配置 API,或者通過以下配置從 Aspose Repository 訪問它:

存儲庫:

 <repositories>
     <repository>
         <id>snapshots</id>
         <name>repo</name>
         <url>http://repository.aspose.com/repo/</url>
     </repository>
</repositories>

依賴:

 <dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-html</artifactId>
        <version>22.7</version>
        <classifier>jdk17</classifier>
    </dependency>
</dependencies>

在 Java 中以編程方式將 HTML 轉換為文本

以下步驟顯示瞭如何在 Java 中以編程方式將 HTML 轉換為文本:

  1. 使用 HTMLDocument 類加載輸入 HTML 文件。
  2. 創建 TextSaveOptions 類的對象。
  3. 將 HTML 轉換為文本文件。

以下示例代碼顯示瞭如何在 Java 中以編程方式將 HTML 轉換為文本:

// 準備一段HTML代碼並保存到文件中
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
    fileWriter.write(code);
}

// 從文件初始化 HTML 文檔
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
    // 初始化 TextSaveOptions 類對象
    com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
    
    // 將 HTML 轉換為文本
    com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
    if (document != null) {
        document.dispose();
    }
}

探索 Aspose.HTML for Java

您可以通過訪問 文檔 空間來探索 API 的許多其他功能。它包含不同的部分和章節來解釋不同 API 類公開的方法和屬性。

結論

總之,您已經探索瞭如何在 Java 中以編程方式將 HTML 轉換為文本。將文本字符串從 HTML 頁面導出為純文本格式可能很有用。此外,如有任何疑慮,請隨時通過 論壇 與我們聯繫。

也可以看看