Chuyển đổi tệp HTML sang Word DOCX DOC trong Java

Trong các trường hợp khác nhau, bạn có thể cần chuyển đổi nội dung HTML sang tài liệu Word. Ví dụ: để tạo tài liệu từ trình soạn thảo WYSIWYG HTML hoặc chuyển đổi một trang web sang định dạng DOCX hoặc DOC. Để thực hiện chuyển đổi này theo chương trình, bài viết này trình bày cách chuyển đổi tệp HTML sang Word DOCX, DOC, DOCM hoặc các định dạng khác trong Java.

Thư viện Java để chuyển đổi HTML sang Word

Để chuyển đổi HTML sang các định dạng DOCX, DOC, DOT, DOCM và các định dạng Word khác, chúng tôi sẽ sử dụng Aspose.Words dành cho Java. Nó là một thư viện mạnh mẽ để tạo và thao tác các tài liệu Word theo chương trình. Hơn nữa, nó cung cấp một công cụ chuyển đổi tài liệu tích hợp cung cấp khả năng chuyển đổi trung thực cao từ / sang các tài liệu xử lý Word. Bạn có thể tải xuống JAR của API từ phần tải xuống hoặc cài đặt nó bằng cách sử dụng các cấu hình Maven sau trong pom.xml.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Chuyển đổi HTML sang DOCX / DOC / DOCM trong Java

Sử dụng Aspose.Words dành cho Java, việc chuyển đổi tệp HTML sang định dạng Word có thể được thực hiện theo một vài bước, được đề cập bên dưới.

Phương thức SaveFormat trong Document.save() chỉ định định dạng mà bạn muốn chuyển đổi tệp HTML. Mẫu mã sau đây cho thấy cách tạo tài liệu Word từ HTML trong Java.

// Tải tệp HTML bằng lớp Tài liệu
Document document = new Document("template.html");

// Chuyển đổi tệp HTML sang định dạng Word DOCX
document.save("output.docx", SaveFormat.DOCX); 

Chuyển đổi một trang web thành Word bằng cách sử dụng URL trong Java

Bạn cũng có thể chuyển đổi một trang web thành tài liệu Word trực tiếp từ URL của nó. Sau đây là các bước để chuyển đổi HTML sang DOCX bằng cách sử dụng URL trong Java.

  • Tạo một phiên bản của lớp URL và khởi tạo nó với URL mong muốn.
  • Mở URL thành một đối tượng InputStream.
  • Tạo một thể hiện của lớp HtmlLoadOptions.
  • Tạo một thể hiện của lớp Document và khởi tạo nó bằng các đối tượng InputStream và HtmlLoadOptions.
  • Lưu trang web dưới dạng tài liệu Word bằng phương pháp Document.save (string, SaveFormat).

Mẫu mã sau đây cho thấy cách chuyển đổi một trang web thành tài liệu Word bằng cách sử dụng URL.

// Tạo và khởi tạo URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// Lấy trang web làm luồng đầu vào
InputStream is = oracleURL.openStream();

// Khởi tạo các tùy chọn tải HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// Tải luồng vào đối tượng Tài liệu
Document doc = new Document(is, htmloptions);

// Lưu dưới dạng DOCX
doc.save("output.docx", SaveFormat.DOCX);

Chuyển đổi chuỗi HTML sang Word bằng Java

Aspose. AdWords dành cho Java cũng cho phép bạn tạo tài liệu Word từ chuỗi HTML một cách tự động. Sau đây là các bước để thực hiện thao tác này.

Mẫu mã sau đây cho thấy cách chuyển đổi một chuỗi HTML thành tệp DOCX bằng Java.

// Tạo một tài liệu mới
Document doc = new Document();

// Tạo một trình xây dựng tài liệu
DocumentBuilder builder = new DocumentBuilder(doc);

// Chèn HTML
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// Lưu dưới dạng DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);

Nhận giấy phép API miễn phí

Bạn có thể sử dụng Aspose.Words dành cho Java mà không bị giới hạn đánh giá bằng cách nhận giấy phép tạm thời miễn phí.

Sự kết luận

Trong bài viết này, bạn đã học cách chuyển đổi tệp HTML sang Word DOCX, DOC, DOCM hoặc các định dạng khác theo lập trình bằng Java. Hơn nữa, bạn đã thấy cách chuyển đổi động một chuỗi HTML hoặc một trang web từ URL sang tài liệu Word. Bạn có thể chỉ cần cài đặt Aspose.Words dành cho Java và sử dụng mã được cung cấp để tạo trình chuyển đổi HTML sang Word của mình. Bên cạnh đó, bạn có thể truy cập tài liệu để khám phá thêm về Aspose.Words dành cho Java. Hơn nữa, bạn có thể chia sẻ các thắc mắc của mình với chúng tôi trên diễn đàn của chúng tôi.

Xem thêm

Thông tin: Nếu bạn cần lấy tài liệu Word từ bản trình bày PowerPoint, bạn có thể sử dụng trình chuyển đổi Aspose Trình bày sang Tài liệu Word.