XML 是一種類似於 HTML 的著名標記語言。然而,它的用途遍及多個領域,例如數據管理、Web、Office 工具、文檔等。在特定情況下,PDF 文檔被轉換為 XML 文件以獲得內容的結構化表示。因此,可以針對不同的目的更方便地處理 PDF 文檔的基於標籤的表示。因此,在本文中,您將學習如何在 C# .NET 中以編程方式將 PDF 文件轉換為 XML。
將 PDF 轉換為 XML 的 C# .NET API - 免費下載
對於 PDF 到 XML 的轉換,我們將使用 Aspose.PDF for .NET。它是一種流行的 API,允許您從 .NET 應用程序中創建和處理 PDF 文件。此外,它還提供了一個高保真轉換器,可以將 PDF 文件轉換為其他格式。您可以 下載 API 的二進製文件或使用 NuGet 安裝它。
PM> Install-Package Aspose.PDF
在 C# 中將 PDF 轉換為 XML
Aspose.PDF for .NET 允許將 PDF 文檔轉換為以下 XML 標準:
- 移動XML
- PDF格式
讓我們看看如何使用 Aspose.PDF for .NET 將 PDF 轉換為上述每種 XML 格式。
C# PDF 到 MobiXML
以下是在 C# 中將 PDF 轉換為 MobiXML 格式的步驟。
- 使用 Document 類加載 PDF 文檔。
- 使用 Document.Save(string, SaveFormat) 方法將 PDF 轉換為 XML,並將 SaveFormat.MobiXml 作為第二個參數傳遞。
以下代碼示例顯示瞭如何在 C# 中將 PDF 轉換為 MobiXML 格式的 XML。
// 載入PDF文件
var document = new Document("candy.pdf");
// 以 MobiXML 格式保存文檔
document.Save("standard-xml-output.xml", SaveFormat.MobiXml);
C# .NET 中的 PDF 到 PdfXML
要將 PDF 轉換為 PdfXML 格式,您需要將 SaveFormat.PdfXml 作為 Document.Save(string, SaveFormat) 方法的第二個參數傳遞。以下代碼示例顯示瞭如何在 C# 中將 PDF 轉換為 PdfXML 格式。
// 載入PDF文件
var document = new Document("candy.pdf");
// 以 PdfXML 格式保存文檔
document.Save("standard-xml-output.xml", SaveFormat.PdfXml);
C# PDF 到 XML 轉換器 - 獲得免費許可證
您可以獲得免費的臨時許可證,以便在沒有評估限制的情況下使用 Aspose.PDF for .NET。
結論
在本文中,您學習瞭如何在 C# 中將 PDF 文檔轉換為 XML。此外,我們還明確介紹瞭如何以編程方式將 PDF 轉換為 MobiXML 或 PdfXML 格式。此外,您可以使用 文檔 探索有關 .NET PDF API 的更多信息。如果您有任何問題或疑問,可以通過我們的論壇 與我們聯繫。