XML — широко известный язык разметки, похожий на HTML. Однако его использование распространяется на несколько областей, таких как управление данными, Интернет, инструменты Office, документы и т. д. В определенных случаях документы PDF преобразуются в файлы XML для получения структурированного представления содержимого. Таким образом, представление PDF-документов на основе тегов может быть более удобно обработано для различных целей. Соответственно, в этой статье вы узнаете, как программно преобразовать PDF-файл в XML на C# .NET.
C# .NET API для преобразования PDF в XML — скачать бесплатно
Для преобразования PDF в XML мы будем использовать Aspose.PDF для .NET. Это популярный API, который позволяет создавать и обрабатывать PDF-файлы из приложений .NET. Кроме того, он обеспечивает конвертер высокой точности для преобразования файлов PDF в другие форматы. Вы можете скачать двоичные файлы API или установить его с помощью NuGet.
PM> Install-Package Aspose.PDF
Преобразование PDF в XML на C#
Aspose.PDF для .NET позволяет преобразовывать PDF-документы в следующие стандарты XML:
- МобиXML
- PDFXML
Давайте посмотрим, как преобразовать PDF в каждый из вышеупомянутых форматов XML, используя Aspose.PDF для .NET.
С# PDF в MobiXML
Ниже приведены шаги для преобразования PDF в формат MobiXML на C#.
- Загрузите документ PDF с помощью класса Document.
- Преобразуйте PDF в XML с помощью метода Document.Save(string, SaveFormat) и передайте SaveFormat.MobiXml в качестве второго параметра.
В следующем примере кода показано, как преобразовать PDF в XML с помощью формата MobiXML на C#.
// Загрузить PDF-документ
var document = new Document("candy.pdf");
// Сохранить документ в формате MobiXML
document.Save("standard-xml-output.xml", SaveFormat.MobiXml);
PDF в PdfXML на C# .NET
Чтобы преобразовать PDF в формат PdfXML, вам необходимо передать SaveFormat.PdfXml в качестве второго параметра метода Document.Save(string, SaveFormat). В следующем примере кода показано, как преобразовать PDF в формат PdfXML на C#.
// Загрузить PDF-документ
var document = new Document("candy.pdf");
// Сохранить документ в формате PdfXML
document.Save("standard-xml-output.xml", SaveFormat.PdfXml);
Конвертер C# PDF в XML - Получите бесплатную лицензию
Вы можете получить бесплатную временную лицензию, чтобы использовать Aspose.PDF для .NET без ограничений на пробную версию.
Вывод
В этой статье вы узнали, как преобразовать PDF-документ в XML на C#. Кроме того, мы подробно рассмотрели, как программно преобразовать PDF в формат MobiXML или PdfXML. Кроме того, вы можете узнать больше о .NET PDF API, используя документацию. Если у вас возникнут какие-либо вопросы или вопросы, вы можете связаться с нами через наш форум.