XML là một ngôn ngữ đánh dấu đa năng được sử dụng cho nhiều mục đích, chẳng hạn như quản lý dữ liệu, web, công cụ Office, tài liệu, v.v. Vì XML rất thuận tiện để được xử lý bởi các chương trình máy tính, PDF các tài liệu thường được chuyển đổi sang các định dạng XML để có được sự trình bày có cấu trúc của nội dung. XML được chuyển đổi sử dụng các thẻ khác nhau để đại diện cho tài liệu PDF. Trong bài viết này, bạn sẽ học cách chuyển đổi một tệp PDF sang XML theo chương trình trong Java.
Java API để chuyển đổi PDF sang XML - Tải xuống miễn phí
Aspose.PDF dành cho Java là một API mạnh mẽ để tạo và thao tác PDF. Sử dụng API, bạn có thể tạo, xử lý và chuyển đổi liền mạch các tệp PDF có bố cục đơn giản và phức tạp. Chúng tôi sẽ sử dụng API này để chuyển đổi PDF sang XML trong bài viết này. Bạn có thể tải xuống JAR của API hoặc cài đặt nó bằng cách sử dụng các cấu hình Maven sau.
Kho:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
Sự phụ thuộc:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>22.4</version>
</dependency>
Chuyển đổi PDF sang XML trong Java
Aspose.PDF hỗ trợ các tiêu chuẩn XML sau để chuyển đổi PDF sang XML:
- MobiXML
- PdfXML
Bạn có thể chọn bất kỳ định dạng nào được đề cập ở trên cho tệp XML được chuyển đổi. Vì vậy, chúng ta hãy tiếp tục xem cách thực hiện chuyển đổi PDF sang XML trong các ứng dụng Java.
Java Chuyển đổi PDF sang MobiXML
Sau đây là các bước để chuyển đổi định dạng PDF sang MobiXML trong Java.
- Tải tài liệu PDF bằng lớp Tài liệu.
- Chuyển đổi PDF sang XML bằng phương thức Document.save (string, SaveFormat) và chuyển SaveFormat.MobiXml làm tham số thứ hai.
Mẫu mã sau đây cho thấy cách chuyển đổi định dạng PDF sang MobiXML trong Java.
// Tải tài liệu PDF
Document document = new Document("candy.pdf");
// Lưu tài liệu ở định dạng MobiXML
document.save("standard-xml-output.xml", SaveFormat.MobiXml);
Chuyển đổi PDF sang PdfXML trong Java
Để chuyển đổi PDF sang định dạng PdfXML, bạn cần chuyển SaveFormat.PdfXml làm tham số thứ hai của phương thức Document.save (string, SaveFormat). Mẫu mã sau đây cho thấy cách chuyển đổi định dạng PDF sang PdfXML trong Java.
// Tải tài liệu PDF
Document document = new Document("candy.pdf");
// Lưu tài liệu ở định dạng MobiXML
document.save("standard-xml-output.xml", SaveFormat.PdfXml);
Java PDF to XML Converter - Nhận Giấy phép Miễn phí
Bạn có thể nhận giấy phép tạm thời miễn phí để sử dụng Aspose.PDF for Java mà không có giới hạn đánh giá.
Sự kết luận
Trong bài viết này, bạn đã học cách chuyển đổi một tài liệu PDF sang XML trong Java. Bạn đã thấy cách chuyển đổi PDF sang định dạng MobiXML hoặc PdfXML theo lập trình. Ngoài ra, bạn có thể truy cập tài liệu để đọc thêm về Aspose.PDF for Java. Trong trường hợp bạn có bất kỳ câu hỏi hoặc thắc mắc nào, bạn có thể liên hệ với chúng tôi qua diễn đàn của chúng tôi.