Chuyển đổi tệp PDF sang XML trong C#

XML là một ngôn ngữ đánh dấu nổi tiếng tương tự như HTML. Tuy nhiên, việc sử dụng nó trải rộng trên nhiều lĩnh vực như quản lý dữ liệu, web, công cụ Office, tài liệu, v.v. Trong các trường hợp cụ thể, tài liệu PDF được chuyển đổi thành tệp XML để có được trình bày có cấu trúc của nội dung. Do đó, biểu diễn dựa trên thẻ của các tài liệu PDF có thể được xử lý thuận tiện hơn cho các mục đích khác nhau. Theo đó, trong bài viết này, bạn sẽ học cách chuyển đổi một tệp PDF sang XML theo chương trình trong C# .NET.

C# .NET API để chuyển đổi PDF sang XML - Tải xuống miễn phí

Để chuyển đổi PDF sang XML, chúng tôi sẽ sử dụng Aspose.PDF for .NET. Đây là một API phổ biến cho phép bạn tạo và xử lý các tệp PDF từ bên trong các ứng dụng .NET. Hơn nữa, nó cung cấp một công cụ chuyển đổi có độ trung thực cao để chuyển đổi các tệp PDF sang các định dạng khác. Bạn có thể tải xuống mã nhị phân của API hoặc cài đặt nó bằng NuGet.

PM> Install-Package Aspose.PDF

Chuyển đổi PDF sang XML trong C#

Aspose.PDF for .NET cho phép chuyển đổi các tài liệu PDF sang các tiêu chuẩn XML sau:

  • MobiXML
  • PdfXML

Hãy xem cách chuyển đổi một tệp PDF sang từng định dạng XML được đề cập ở trên bằng cách sử dụng Aspose.PDF for .NET.

C# PDF sang MobiXML

Sau đây là các bước để chuyển đổi định dạng PDF sang MobiXML trong C#.

Mẫu mã sau đây cho thấy cách chuyển đổi PDF sang XML với định dạng MobiXML trong C#.

// Tải tài liệu PDF
var document = new Document("candy.pdf");

// Lưu tài liệu ở định dạng MobiXML
document.Save("standard-xml-output.xml", SaveFormat.MobiXml);

PDF sang PdfXML trong C# .NET

Để chuyển đổi định dạng PDF sang PdfXML, bạn cần chuyển SaveFormat.PdfXml làm tham số thứ hai của phương thức Document.Save (string, SaveFormat). Mẫu mã sau đây cho thấy cách chuyển đổi định dạng PDF sang PdfXML trong C#.

// Tải tài liệu PDF
var document = new Document("candy.pdf");

// Lưu tài liệu ở định dạng PdfXML
document.Save("standard-xml-output.xml", SaveFormat.PdfXml);

C# PDF to XML Converter - Nhận Giấy phép Miễn phí

Bạn có thể nhận giấy phép tạm thời miễn phí để sử dụng Aspose.PDF for .NET mà không có giới hạn đánh giá.

Sự kết luận

Trong bài viết này, bạn đã học cách chuyển đổi một tài liệu PDF sang XML trong C#. Hơn nữa, chúng tôi đã trình bày rõ ràng cách chuyển đổi PDF sang định dạng MobiXML hoặc PdfXML theo lập trình. Ngoài ra, bạn có thể khám phá thêm về .NET PDF API bằng cách sử dụng tài liệu. Trong trường hợp bạn có bất kỳ câu hỏi hoặc thắc mắc nào, bạn có thể liên hệ với chúng tôi qua diễn đàn của chúng tôi.

Xem thêm