Konvertieren Sie PDF-Dateien in XML in C#

XML ist eine bekannte Auszeichnungssprache ähnlich wie HTML. Seine Verwendung erstreckt sich jedoch über mehrere Domänen wie Datenverwaltung, Web, Office-Tools, Dokumente usw. In bestimmten Fällen werden die PDF-Dokumente in XML-Dateien konvertiert, um die strukturierte Darstellung des Inhalts zu erhalten. Somit kann die Tag-basierte Darstellung der PDF-Dokumente für unterschiedliche Zwecke bequemer verarbeitet werden. Dementsprechend erfahren Sie in diesem Artikel, wie Sie eine PDF-Datei programmgesteuert in C# .NET in XML konvertieren.

C# .NET-API zum Konvertieren von PDF in XML – kostenloser Download

Für die Konvertierung von PDF in XML verwenden wir Aspose.PDF for .NET. Es ist eine beliebte API, mit der Sie PDF-Dateien aus .NET-Anwendungen heraus erstellen und verarbeiten können. Darüber hinaus bietet es einen High-Fidelity-Konverter zum Konvertieren von PDF-Dateien in andere Formate. Sie können die Binärdateien der API herunterladen oder sie mit NuGet installieren.

PM> Install-Package Aspose.PDF

Konvertieren Sie PDF in XML in C#

Aspose.PDF für .NET ermöglicht die Konvertierung von PDF-Dokumenten in die folgenden XML-Standards:

  • MobiXML
  • PdfXML

Sehen wir uns an, wie Sie ein PDF mit Aspose.PDF für .NET in jedes der oben genannten XML-Formate konvertieren.

C#-PDF zu MobiXML

Im Folgenden sind die Schritte zum Konvertieren einer PDF-Datei in das MobiXML-Format in C# aufgeführt.

Das folgende Codebeispiel zeigt, wie Sie eine PDF-Datei mit dem MobiXML-Format in C# in XML konvertieren.

// PDF-Dokument laden
var document = new Document("candy.pdf");

// Dokument im MobiXML-Format speichern
document.Save("standard-xml-output.xml", SaveFormat.MobiXml);

PDF in PdfXML in C# .NET

Um ein PDF in das PdfXML-Format zu konvertieren, müssen Sie SaveFormat.PdfXml als zweiten Parameter der Methode Document.Save(string, SaveFormat) übergeben. Das folgende Codebeispiel zeigt, wie Sie eine PDF-Datei in das PdfXML-Format in C# konvertieren.

// PDF-Dokument laden
var document = new Document("candy.pdf");

// Dokument im PdfXML-Format speichern
document.Save("standard-xml-output.xml", SaveFormat.PdfXml);

C# PDF to XML Converter – Holen Sie sich eine kostenlose Lizenz

Sie können eine kostenlose temporäre Lizenz erhalten, um Aspose.PDF für .NET ohne Evaluierungseinschränkungen zu verwenden.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie ein PDF-Dokument in C# in XML konvertieren. Darüber hinaus haben wir explizit behandelt, wie Sie ein PDF programmgesteuert in das MobiXML- oder PdfXML-Format konvertieren. Darüber hinaus können Sie mithilfe der Dokumentation mehr über die .NET PDF-API erfahren. Falls Sie Fragen oder Anregungen haben, können Sie uns über unser Forum kontaktieren.

Siehe auch