Từ sang HTML Java

Để nhúng nội dung của tài liệu Word vào ứng dụng của bạn, bạn có thể cần thực hiện chuyển đổi. Các chuyển đổi được lựa chọn rộng rãi nhất trong những trường hợp như vậy là Từ sang HTML hoặc Từ sang hình ảnh. Theo đó, bài viết này trình bày cách chuyển đổi tệp Word DOCX hoặc DOC sang HTML bằng Java. Ngoài ra, chúng ta sẽ thảo luận về cách giữ các tệp tài nguyên trong một thư mục riêng biệt.

Java API cho Chuyển đổi Word sang HTML

Để chuyển đổi DOCX / DOC sang HTML, chúng tôi sẽ sử dụng Aspose.Words dành cho Java. Nó là một API mạnh mẽ để triển khai các tính năng xử lý văn bản từ bên trong các ứng dụng Java. Hơn nữa, API cung cấp khả năng chuyển đổi tài liệu Word sang HTML và các định dạng khác có độ trung thực cao. Bạn có thể tải xuống API hoặc cài đặt nó từ Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.10</version>
    <type>pom</type>
</dependency>

Chuyển đổi tài liệu Word sang HTML trong Java

Để chuyển đổi tài liệu Word sang HTML, bạn chỉ cần tải tài liệu và lưu dưới dạng tệp HTML. Sau đây là các bước để chuyển đổi tệp Word DOCX sang HTML bằng Java.

Mẫu mã sau đây cho thấy cách chuyển đổi tài liệu Word sang HTML bằng Java.

// Tải tài liệu từ đĩa
Document doc = new Document("document.docx");

// Lưu tài liệu dưới dạng HTML
doc.save("Document_out.html", SaveFormat.HTML);

Chỉ định Thư mục Tài nguyên trong Chuyển đổi Word sang HTML

Bạn cũng có thể định cấu hình API để lưu các tệp tài nguyên trong một thư mục riêng biệt. Hơn nữa, bạn có thể giữ phông chữ và hình ảnh riêng biệt trong các thư mục khác nhau. Sau đây là các bước để chỉ định thư mục tài nguyên.

Mẫu mã sau đây giữ các tệp tài nguyên trong một thư mục riêng trong chuyển đổi Word sang HTML.

// Tải tài liệu
Document doc = new Document("Document.docx");

// Chỉ định thư mục tài nguyên
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");

// Chuyển đổi tài liệu Word sang HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);

Bạn có thể đọc thêm về cách làm việc với các thư mục tài nguyên trong chuyển đổi Word sang HTML.

Nhận giấy phép API miễn phí

Bạn có thể sử dụng Aspose.Words dành cho Java mà không bị giới hạn đánh giá bằng cách nhận giấy phép tạm thời miễn phí.

Sự kết luận

Trong bài viết này, bạn đã học cách chuyển đổi các tệp Word DOCX hoặc DOC sang HTML theo lập trình bằng Java. Ngoài ra, bạn đã thấy cách lưu trữ các tệp tài nguyên riêng biệt trong chuyển đổi Word sang HTML. Ngoài ra, bạn có thể đọc thêm về Aspose.Words dành cho Java bằng cách sử dụng tài liệu. Hơn nữa, bạn có thể chia sẻ các thắc mắc của mình với chúng tôi trên diễn đàn của chúng tôi.

Xem thêm