Konwertuj pliki PDF na XML w C#

XML to dobrze znany język znaczników podobny do HTML. Jednak jego zastosowania obejmują wiele dziedzin, takich jak zarządzanie danymi, sieć, narzędzia pakietu Office, dokumenty itp. W szczególnych przypadkach dokumenty PDF są konwertowane na pliki XML w celu uzyskania uporządkowanej reprezentacji treści. W ten sposób reprezentację dokumentów PDF opartą na znacznikach można wygodniej przetwarzać do różnych celów. W związku z tym w tym artykule dowiesz się, jak programowo przekonwertować plik PDF na XML w języku C# .NET.

C# .NET API do konwersji plików PDF na XML — bezpłatne pobieranie

Do konwersji PDF na XML użyjemy Aspose.PDF for .NET. Jest to popularny interfejs API, który umożliwia tworzenie i przetwarzanie plików PDF z poziomu aplikacji .NET. Ponadto zapewnia konwerter o wysokiej wierności do konwersji plików PDF na inne formaty. Możesz pobrać pliki binarne API lub zainstalować je za pomocą NuGet.

PM> Install-Package Aspose.PDF

Konwertuj PDF na XML w C#

Aspose.PDF for .NET umożliwia konwersję dokumentów PDF do następujących standardów XML:

  • MobiXML
  • PDFXML

Zobaczmy, jak przekonwertować plik PDF na każdy z wyżej wymienionych formatów XML za pomocą Aspose.PDF for .NET.

C# PDF do MobiXML

Poniżej przedstawiono kroki konwersji pliku PDF na format MobiXML w języku C#.

Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na XML przy użyciu formatu MobiXML w języku C#.

// Załaduj dokument PDF
var document = new Document("candy.pdf");

// Zapisz dokument w formacie MobiXML
document.Save("standard-xml-output.xml", SaveFormat.MobiXml);

PDF do PdfXML w C# .NET

Aby przekonwertować plik PDF na format PdfXML, musisz przekazać SaveFormat.PdfXml jako drugi parametr metody Document.Save(string, SaveFormat). Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na format PdfXML w języku C#.

// Załaduj dokument PDF
var document = new Document("candy.pdf");

// Zapisz dokument w formacie PdfXML
document.Save("standard-xml-output.xml", SaveFormat.PdfXml);

C# PDF to XML Converter — Uzyskaj bezpłatną licencję

Możesz uzyskać bezpłatną tymczasową licencję, aby używać Aspose.PDF for .NET bez ograniczeń ewaluacyjnych.

Wniosek

W tym artykule nauczyłeś się, jak przekonwertować dokument PDF na XML w języku C#. Ponadto wyraźnie omówiliśmy, jak programowo przekonwertować plik PDF na format MobiXML lub PdfXML. Ponadto możesz dowiedzieć się więcej o interfejsie API .NET PDF, korzystając z dokumentacji. W przypadku jakichkolwiek pytań lub wątpliwości możesz skontaktować się z nami za pośrednictwem naszego forum.

Zobacz też