XML adalah bahasa markup terkenal yang mirip dengan HTML. Namun, penggunaannya tersebar di beberapa domain seperti manajemen data, web, alat Office, dokumen, dll. Dalam kasus tertentu, dokumen PDF diubah menjadi file XML untuk mendapatkan representasi konten yang terstruktur. Dengan demikian, representasi dokumen PDF berbasis tag dapat diproses dengan lebih mudah untuk tujuan yang berbeda. Oleh karena itu, dalam artikel ini, Anda akan mempelajari cara mengonversi file PDF ke XML secara terprogram di C# .NET.
C# .NET API untuk Mengonversi PDF ke XML - Unduhan Gratis
Untuk konversi PDF ke XML, kami akan menggunakan Anggap.PDF untuk .NET. Ini adalah API populer yang memungkinkan Anda membuat dan memproses file PDF dari dalam aplikasi .NET. Selain itu, ini menyediakan konverter fidelitas tinggi untuk mengonversi file PDF ke format lain. Anda dapat mengunduh binari API atau menginstalnya menggunakan NuGet.
PM> Install-Package Aspose.PDF
Konversi PDF ke XML dalam C#
Aspose.PDF for .NET memungkinkan konversi dokumen PDF ke standar XML berikut:
- MobiXML
- PdfXML
Mari kita lihat cara mengonversi PDF ke setiap format XML yang disebutkan di atas menggunakan Aspose.PDF for .NET.
C# PDF ke MobiXML
Berikut ini adalah langkah-langkah untuk mengonversi format PDF ke MobiXML di C#.
- Muat dokumen PDF menggunakan kelas Document.
- Konversikan PDF ke XML menggunakan metode Document.Save(string, SaveFormat) dan berikan SaveFormat.MobiXml sebagai parameter kedua.
Contoh kode berikut menunjukkan cara mengonversi PDF ke XML dengan format MobiXML di C#.
// Muat dokumen PDF
var document = new Document("candy.pdf");
// Simpan dokumen dalam format MobiXML
document.Save("standard-xml-output.xml", SaveFormat.MobiXml);
PDF ke PdfXML di C# .NET
Untuk mengonversi format PDF ke PdfXML, Anda harus meneruskan SaveFormat.PdfXml sebagai parameter kedua dari metode Document.Save(string, SaveFormat). Contoh kode berikut menunjukkan cara mengonversi format PDF ke PdfXML di C#.
// Muat dokumen PDF
var document = new Document("candy.pdf");
// Simpan dokumen dalam format PdfXML
document.Save("standard-xml-output.xml", SaveFormat.PdfXml);
C# PDF to XML Converter - Dapatkan Lisensi Gratis
Anda bisa mendapatkan lisensi sementara gratis untuk menggunakan Aspose.PDF for .NET tanpa batasan evaluasi.
Kesimpulan
Pada artikel ini, Anda telah mempelajari cara mengonversi dokumen PDF ke XML dalam C#. Selain itu, kami telah secara eksplisit membahas cara mengonversi format PDF ke MobiXML atau PdfXML secara terprogram. Selain itu, Anda dapat mempelajari lebih lanjut tentang .NET PDF API menggunakan dokumentasi. Jika Anda memiliki pertanyaan atau pertanyaan, Anda dapat menghubungi kami melalui forum kami.