HTML 到文本 Java

HTML 页面在 Internet 上被广泛使用。它们可能包含用于呈现信息的图像、绘图和文本。有时,您可能需要将 HTML 文件转换为文本格式。因此,本文介绍了如何在 Java 中以编程方式将 HTML 转换为 Text

HTML 到文本转换器 – Java API 安装

Aspose.HTML for Java API 支持 HTML、MHTML、文本和许多其他 文件格式。您可以通过从 New Releases 部分下载其 JAR 文件来快速配置 API,或者通过以下配置从 Aspose Repository 访问它:

存储库:

 <repositories>
     <repository>
         <id>snapshots</id>
         <name>repo</name>
         <url>http://repository.aspose.com/repo/</url>
     </repository>
</repositories>

依赖:

 <dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-html</artifactId>
        <version>22.7</version>
        <classifier>jdk17</classifier>
    </dependency>
</dependencies>

在 Java 中以编程方式将 HTML 转换为文本

以下步骤显示了如何在 Java 中以编程方式将 HTML 转换为文本:

  1. 使用 HTMLDocument 类加载输入 HTML 文件。
  2. 创建一个 TextSaveOptions 类的对象。
  3. 将 HTML 转换为文本文件。

以下示例代码显示了如何在 Java 中以编程方式将 HTML 转换为文本:

// 准备 HTML 代码并将其保存到文件中
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
    fileWriter.write(code);
}

// 从文件初始化 HTML 文档
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
    // 初始化 TextSaveOptions 类对象
    com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
    
    // 将 HTML 转换为文本
    com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
    if (document != null) {
        document.dispose();
    }
}

探索 Aspose.HTML for Java

您可以通过访问 文档 空间来探索 API 的许多其他功能。它包含不同的部分和章节来解释 API 的不同类公开的方法和属性。

结论

总之,您已经探索了如何在 Java 中以编程方式将 HTML 转换为文本。将文本字符串从 HTML 页面导出为纯文本格式会很有用。此外,如有任何疑问,请随时通过 论坛 与我们联系。

也可以看看