Chuyển đổi tệp PDF sang XML trong Java

XML là một ngôn ngữ đánh dấu đa năng được sử dụng cho nhiều mục đích, chẳng hạn như quản lý dữ liệu, web, công cụ Office, tài liệu, v.v. Vì XML rất thuận tiện để được xử lý bởi các chương trình máy tính, PDF các tài liệu thường được chuyển đổi sang các định dạng XML để có được sự trình bày có cấu trúc của nội dung. XML được chuyển đổi sử dụng các thẻ khác nhau để đại diện cho tài liệu PDF. Trong bài viết này, bạn sẽ học cách chuyển đổi một tệp PDF sang XML theo chương trình trong Java.

Java API để chuyển đổi PDF sang XML - Tải xuống miễn phí

Aspose.PDF dành cho Java là một API mạnh mẽ để tạo và thao tác PDF. Sử dụng API, bạn có thể tạo, xử lý và chuyển đổi liền mạch các tệp PDF có bố cục đơn giản và phức tạp. Chúng tôi sẽ sử dụng API này để chuyển đổi PDF sang XML trong bài viết này. Bạn có thể tải xuống JAR của API hoặc cài đặt nó bằng cách sử dụng các cấu hình Maven sau.

Kho:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Sự phụ thuộc:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>22.4</version>
</dependency>

Chuyển đổi PDF sang XML trong Java

Aspose.PDF hỗ trợ các tiêu chuẩn XML sau để chuyển đổi PDF sang XML:

  • MobiXML
  • PdfXML

Bạn có thể chọn bất kỳ định dạng nào được đề cập ở trên cho tệp XML được chuyển đổi. Vì vậy, chúng ta hãy tiếp tục xem cách thực hiện chuyển đổi PDF sang XML trong các ứng dụng Java.

Java Chuyển đổi PDF sang MobiXML

Sau đây là các bước để chuyển đổi định dạng PDF sang MobiXML trong Java.

Mẫu mã sau đây cho thấy cách chuyển đổi định dạng PDF sang MobiXML trong Java.

// Tải tài liệu PDF
Document document = new Document("candy.pdf");

// Lưu tài liệu ở định dạng MobiXML
document.save("standard-xml-output.xml", SaveFormat.MobiXml);

Chuyển đổi PDF sang PdfXML trong Java

Để chuyển đổi PDF sang định dạng PdfXML, bạn cần chuyển SaveFormat.PdfXml làm tham số thứ hai của phương thức Document.save (string, SaveFormat). Mẫu mã sau đây cho thấy cách chuyển đổi định dạng PDF sang PdfXML trong Java.

// Tải tài liệu PDF
Document document = new Document("candy.pdf");

// Lưu tài liệu ở định dạng MobiXML
document.save("standard-xml-output.xml", SaveFormat.PdfXml);

Java PDF to XML Converter - Nhận Giấy phép Miễn phí

Bạn có thể nhận giấy phép tạm thời miễn phí để sử dụng Aspose.PDF for Java mà không có giới hạn đánh giá.

Sự kết luận

Trong bài viết này, bạn đã học cách chuyển đổi một tài liệu PDF sang XML trong Java. Bạn đã thấy cách chuyển đổi PDF sang định dạng MobiXML hoặc PdfXML theo lập trình. Ngoài ra, bạn có thể truy cập tài liệu để đọc thêm về Aspose.PDF for Java. Trong trường hợp bạn có bất kỳ câu hỏi hoặc thắc mắc nào, bạn có thể liên hệ với chúng tôi qua diễn đàn của chúng tôi.

Xem thêm