XML to dobrze znany język znaczników podobny do HTML. Jednak jego zastosowania obejmują wiele dziedzin, takich jak zarządzanie danymi, sieć, narzędzia pakietu Office, dokumenty itp. W szczególnych przypadkach dokumenty PDF są konwertowane na pliki XML w celu uzyskania uporządkowanej reprezentacji treści. W ten sposób reprezentację dokumentów PDF opartą na znacznikach można wygodniej przetwarzać do różnych celów. W związku z tym w tym artykule dowiesz się, jak programowo przekonwertować plik PDF na XML w języku C# .NET.
C# .NET API do konwersji plików PDF na XML — bezpłatne pobieranie
Do konwersji PDF na XML użyjemy Aspose.PDF for .NET. Jest to popularny interfejs API, który umożliwia tworzenie i przetwarzanie plików PDF z poziomu aplikacji .NET. Ponadto zapewnia konwerter o wysokiej wierności do konwersji plików PDF na inne formaty. Możesz pobrać pliki binarne API lub zainstalować je za pomocą NuGet.
PM> Install-Package Aspose.PDF
Konwertuj PDF na XML w C#
Aspose.PDF for .NET umożliwia konwersję dokumentów PDF do następujących standardów XML:
- MobiXML
- PDFXML
Zobaczmy, jak przekonwertować plik PDF na każdy z wyżej wymienionych formatów XML za pomocą Aspose.PDF for .NET.
C# PDF do MobiXML
Poniżej przedstawiono kroki konwersji pliku PDF na format MobiXML w języku C#.
- Załaduj dokument PDF za pomocą klasy Document.
- Konwertuj PDF na XML za pomocą metody Document.Save(string, SaveFormat) i przekaż SaveFormat.MobiXml jako drugi parametr.
Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na XML przy użyciu formatu MobiXML w języku C#.
// Załaduj dokument PDF
var document = new Document("candy.pdf");
// Zapisz dokument w formacie MobiXML
document.Save("standard-xml-output.xml", SaveFormat.MobiXml);
PDF do PdfXML w C# .NET
Aby przekonwertować plik PDF na format PdfXML, musisz przekazać SaveFormat.PdfXml jako drugi parametr metody Document.Save(string, SaveFormat). Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na format PdfXML w języku C#.
// Załaduj dokument PDF
var document = new Document("candy.pdf");
// Zapisz dokument w formacie PdfXML
document.Save("standard-xml-output.xml", SaveFormat.PdfXml);
C# PDF to XML Converter — Uzyskaj bezpłatną licencję
Możesz uzyskać bezpłatną tymczasową licencję, aby używać Aspose.PDF for .NET bez ograniczeń ewaluacyjnych.
Wniosek
W tym artykule nauczyłeś się, jak przekonwertować dokument PDF na XML w języku C#. Ponadto wyraźnie omówiliśmy, jak programowo przekonwertować plik PDF na format MobiXML lub PdfXML. Ponadto możesz dowiedzieć się więcej o interfejsie API .NET PDF, korzystając z dokumentacji. W przypadku jakichkolwiek pytań lub wątpliwości możesz skontaktować się z nami za pośrednictwem naszego forum.