Chuyển đổi DOCX sang JSON trong Java

Trong một số trường hợp nhất định, bạn cần xuất nội dung của Word DOCX sang tệp JSON theo lập trình. Để đạt được điều đó, bài viết này cung cấp một hướng dẫn đơn giản về cách chuyển đổi văn bản trong tài liệu DOCX sang định dạng JSON từ bên trong các ứng dụng Java của bạn. Bạn cũng sẽ học cách chuyển đổi các tài liệu DOCX được bảo vệ sang JSON theo lập trình. Vì vậy, chúng ta hãy tiến hành chuyển đổi DOCX sang JSON trong Java.

Cách chuyển đổi DOCX sang JSON trong Java

Để chuyển đổi tài liệu DOCX sang định dạng JSON, chúng ta cần thực hiện các bước sau:

  • Tải tài liệu DOCX.
  • Chuyển nó sang định dạng HTML.
  • Lưu tệp HTML ở định dạng JSON.

Hãy xem cách thực hiện các bước này theo chương trình trong Java. Đối với điều này, bạn cần phải cài đặt hai thư viện được đề cập trong phần sau.

Thư viện Java để chuyển đổi DOCX sang JSON - Tải xuống miễn phí

Aspose.Words dành cho Java là một thư viện mạnh mẽ cho phép bạn tạo và xử lý các tài liệu MS Word. Chúng tôi sẽ sử dụng thư viện này để xuất nội dung của tệp DOCX sang HTML. Sau đó, chúng tôi sẽ sử dụng Aspose.Cells for Java để lưu nội dung HTML dưới dạng tệp JSON. Bạn có thể tải xuống JAR của cả hai thư viện hoặc cài đặt chúng bằng cách sử dụng cấu hình Maven.

Tải xuống JAR

Cài đặt qua Maven

<dependencies>
	<dependency>
		<groupId>com.aspose</groupId>
		<artifactId>aspose-words</artifactId>
		<version>22.7</version>
		<classifier>jdk17</classifier>
	</dependency>
	<dependency>
		<groupId>com.aspose</groupId>
		<artifactId>aspose-cells</artifactId>
		<version>22.7</version>
	</dependency>
</dependencies>
<repositories>
	<repository>
		<id>AsposeJavaAPI</id>
		<name>Aspose Java API</name>
		<url>https://repository.aspose.com/repo/</url>
	</repository>
</repositories>

Chuyển đổi DOCX sang JSON trong Java

Sau đây là các bước để chuyển đổi DOCX sang JSON trong Java.

Mẫu mã sau đây cho thấy cách chuyển đổi tài liệu DOCX sang JSON trong Java.

// Tải tài liệu Word bằng Aspose.Words
Document doc = new Document("sample1.docx");

// Lưu dưới dạng HTML
doc.save("html_output.html", SaveFormat.HTML);

// Tải tệp HTML đã lưu bằng Aspose.Cells
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");

// Lưu HTML dưới dạng JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);

Java Chuyển đổi DOCX được bảo vệ sang JSON

Bạn cũng có thể tải các tài liệu DOCX được bảo vệ bằng mật khẩu của chúng và chuyển đổi chúng sang định dạng JSON. Sau đây là các bước để chuyển đổi tài liệu DOCX được bảo vệ sang JSON trong Java.

Mẫu mã sau đây cho thấy cách chuyển đổi tài liệu DOCX được bảo vệ sang JSON trong Java.

// Tải tài liệu Word bằng Aspose.Words
Document doc = new Document("sample1.docx", new com.aspose.words.LoadOptions("MyPassword"));

// Lưu dưới dạng HTML
doc.save("html_output.html", SaveFormat.HTML);

// Tải tệp HTML đã lưu bằng Aspose.Cells
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");

// Lưu HTML dưới dạng JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);

Thư viện chuyển đổi Java DOCX sang JSON - Nhận Giấy phép Miễn phí

Bạn có thể nhận giấy phép tạm thời miễn phí để sử dụng các thư viện mà không có giới hạn đánh giá.

Sự kết luận

Trong bài viết này, bạn đã học cách chuyển đổi DOCX sang JSON trong Java. Hơn nữa, bạn đã thấy cách chuyển đổi tài liệu DOCX được bảo vệ bằng mật khẩu sang JSON theo chương trình. Bên cạnh đó, bạn có thể truy cập tài liệu của Aspose.Words dành cho JavaAspose.Cells dành cho Java để khám phá các tính năng khác. Trong trường hợp bạn có bất kỳ câu hỏi nào, vui lòng cho chúng tôi biết qua diễn đàn của chúng tôi.

Xem thêm