HTML sang văn bản Java

Các trang HTML được sử dụng rộng rãi trên internet. Chúng có thể chứa hình ảnh, hình vẽ và văn bản để trình bày thông tin. Đôi khi, bạn có thể cần chuyển đổi tệp HTML sang Văn bản. Theo đó, bài viết này trình bày cách chuyển đổi HTML thành text theo lập trình trong Java.

Chuyển đổi HTML sang văn bản - Cài đặt Java API

Aspose.HTML for Java API hỗ trợ HTML, MHTML, Text và nhiều [định dạng tệp] khác 4. Bạn có thể nhanh chóng định cấu hình API bằng cách tải xuống tệp JAR của nó từ phần Bản phát hành mới hoặc thông qua các cấu hình sau để truy cập nó từ Kho lưu trữ Aspose:

Kho:

 <repositories>
     <repository>
         <id>snapshots</id>
         <name>repo</name>
         <url>http://repository.aspose.com/repo/</url>
     </repository>
</repositories>

Sự phụ thuộc:

 <dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-html</artifactId>
        <version>22.7</version>
        <classifier>jdk17</classifier>
    </dependency>
</dependencies>

Chuyển đổi HTML sang văn bản theo phương pháp lập trình trong Java

Các bước sau đây cho thấy cách chuyển đổi HTML sang Văn bản theo chương trình trong Java:

  1. Tải tệp HTML đầu vào bằng lớp HTMLDocument.
  2. Tạo một đối tượng của lớp TextSaveOptions.
  3. Chuyển đổi HTML thành tệp Văn bản.

Đoạn mã mẫu sau đây cho thấy cách chuyển đổi HTML sang Văn bản theo chương trình trong Java:

// Chuẩn bị mã HTML và lưu vào tệp
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
    fileWriter.write(code);
}

// Khởi tạo tài liệu HTML từ tệp
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
    // Khởi tạo đối tượng lớp TextSaveOptions
    com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
    
    // Chuyển đổi HTML sang văn bản
    com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
    if (document != null) {
        document.dispose();
    }
}

Khám phá Aspose.HTML dành cho Java

Bạn có thể khám phá nhiều tính năng khác của API bằng cách truy cập không gian tài liệu. Nó chứa các phần và chương khác nhau để giải thích các phương thức và thuộc tính được hiển thị bởi các lớp khác nhau của API.

Sự kết luận

Tóm lại, bạn đã khám phá cách chuyển đổi HTML sang Văn bản theo chương trình trong Java. Có thể hữu ích khi xuất chuỗi văn bản từ trang HTML sang định dạng văn bản thuần túy. Hơn nữa, vui lòng liên hệ với chúng tôi qua diễn đàn nếu có bất kỳ thắc mắc nào.

Xem thêm