Преобразование PDF-файлов в XML на C#

XML — широко известный язык разметки, похожий на HTML. Однако его использование распространяется на несколько областей, таких как управление данными, Интернет, инструменты Office, документы и т. д. В определенных случаях документы PDF преобразуются в файлы XML для получения структурированного представления содержимого. Таким образом, представление PDF-документов на основе тегов может быть более удобно обработано для различных целей. Соответственно, в этой статье вы узнаете, как программно преобразовать PDF-файл в XML на C# .NET.

C# .NET API для преобразования PDF в XML — скачать бесплатно

Для преобразования PDF в XML мы будем использовать Aspose.PDF для .NET. Это популярный API, который позволяет создавать и обрабатывать PDF-файлы из приложений .NET. Кроме того, он обеспечивает конвертер высокой точности для преобразования файлов PDF в другие форматы. Вы можете скачать двоичные файлы API или установить его с помощью NuGet.

PM> Install-Package Aspose.PDF

Преобразование PDF в XML на C#

Aspose.PDF для .NET позволяет преобразовывать PDF-документы в следующие стандарты XML:

  • МобиXML
  • PDFXML

Давайте посмотрим, как преобразовать PDF в каждый из вышеупомянутых форматов XML, используя Aspose.PDF для .NET.

С# PDF в MobiXML

Ниже приведены шаги для преобразования PDF в формат MobiXML на C#.

В следующем примере кода показано, как преобразовать PDF в XML с помощью формата MobiXML на C#.

// Загрузить PDF-документ
var document = new Document("candy.pdf");

// Сохранить документ в формате MobiXML
document.Save("standard-xml-output.xml", SaveFormat.MobiXml);

PDF в PdfXML на C# .NET

Чтобы преобразовать PDF в формат PdfXML, вам необходимо передать SaveFormat.PdfXml в качестве второго параметра метода Document.Save(string, SaveFormat). В следующем примере кода показано, как преобразовать PDF в формат PdfXML на C#.

// Загрузить PDF-документ
var document = new Document("candy.pdf");

// Сохранить документ в формате PdfXML
document.Save("standard-xml-output.xml", SaveFormat.PdfXml);

Конвертер C# PDF в XML - Получите бесплатную лицензию

Вы можете получить бесплатную временную лицензию, чтобы использовать Aspose.PDF для .NET без ограничений на пробную версию.

Вывод

В этой статье вы узнали, как преобразовать PDF-документ в XML на C#. Кроме того, мы подробно рассмотрели, как программно преобразовать PDF в формат MobiXML или PdfXML. Кроме того, вы можете узнать больше о .NET PDF API, используя документацию. Если у вас возникнут какие-либо вопросы или вопросы, вы можете связаться с нами через наш форум.

Смотрите также