Converti file PDF in XML in C#

XML è un noto linguaggio di markup simile all’HTML. Tuttavia, i suoi usi si diffondono su più domini come gestione dei dati, web, strumenti di Office, documenti, ecc. In casi particolari, i documenti PDF vengono convertiti in file XML per ottenere la rappresentazione strutturata del contenuto. Pertanto, la rappresentazione basata su tag dei documenti PDF può essere elaborata in modo più conveniente per scopi diversi. Di conseguenza, in questo articolo imparerai come convertire un file PDF in XML a livello di codice in C# .NET.

API C# .NET per convertire PDF in XML - Download gratuito

Per la conversione da PDF a XML, utilizzeremo Aspose.PDF for .NET. È un’API popolare che consente di creare ed elaborare file PDF dall’interno di applicazioni .NET. Inoltre, fornisce un convertitore ad alta fedeltà per convertire i file PDF in altri formati. Puoi scaricare i binari dell’API o installarlo utilizzando NuGet.

PM> Install-Package Aspose.PDF

Converti PDF in XML in C#

Aspose.PDF for .NET consente la conversione di documenti PDF nei seguenti standard XML:

  • MobiXML
  • PdfXML

Vediamo come convertire un PDF in ciascuno dei formati XML sopra menzionati utilizzando Aspose.PDF per .NET.

C# da PDF a MobiXML

Di seguito sono riportati i passaggi per convertire un PDF in formato MobiXML in C#.

L’esempio di codice seguente mostra come convertire un PDF in XML con il formato MobiXML in C#.

// Carica documento PDF
var document = new Document("candy.pdf");

// Salva il documento in formato MobiXML
document.Save("standard-xml-output.xml", SaveFormat.MobiXml);

PDF in PdfXML in C# .NET

Per convertire un PDF in formato PdfXML, è necessario passare SaveFormat.PdfXml come secondo parametro del metodo Document.Save(string, SaveFormat). L’esempio di codice seguente mostra come convertire un PDF in formato PdfXML in C#.

// Carica documento PDF
var document = new Document("candy.pdf");

// Salva il documento in formato PdfXML
document.Save("standard-xml-output.xml", SaveFormat.PdfXml);

Convertitore C# da PDF a XML - Ottieni una licenza gratuita

Puoi ottenere una licenza temporanea gratuita per utilizzare Aspose.PDF per .NET senza limitazioni di valutazione.

Conclusione

In questo articolo, hai imparato come convertire un documento PDF in XML in C#. Inoltre, abbiamo spiegato in modo esplicito come convertire un PDF in formato MobiXML o PdfXML a livello di codice. Inoltre, puoi esplorare di più sull’API .NET PDF utilizzando la documentazione. In caso di domande o domande, puoi contattarci tramite il nostro forum.

Guarda anche