在 C# 中将 PDF 文件转换为 XML

XML 是一种类似于 HTML 的著名标记语言。然而,它的用途分布在多个领域,例如数据管理、Web、Office 工具、文档等。在特定情况下,PDF 文档被转换为 XML 文件以获得内容的结构化表示。因此,PDF 文档的基于标签的表示可以更方便地用于不同目的。因此,在本文中,您将学习如何在 C# .NET 中以编程方式将 PDF 文件转换为 XML。

C# .NET API 将 PDF 转换为 XML - 免费下载

对于 PDF 到 XML 的转换,我们将使用 Aspose.PDF for .NET。它是一种流行的 API,允许您在 .NET 应用程序中创建和处理 PDF 文件。此外,它还提供了一个高保真转换器,可以将 PDF 文件转换为其他格式。您可以 下载 API 的二进制文件或使用 NuGet 安装它。

PM> Install-Package Aspose.PDF

在 C# 中将 PDF 转换为 XML

Aspose.PDF for .NET 允许将 PDF 文档转换为以下 XML 标准:

  • 移动XML
  • PdfXML

让我们看看如何使用 Aspose.PDF for .NET 将 PDF 转换为上述每种 XML 格式。

C# PDF 到 MobiXML

以下是在 C# 中将 PDF 转换为 MobiXML 格式的步骤。

以下代码示例展示了如何在 C# 中将 PDF 转换为具有 MobiXML 格式的 XML。

// 加载 PDF 文档
var document = new Document("candy.pdf");

// 以 MobiXML 格式保存文档
document.Save("standard-xml-output.xml", SaveFormat.MobiXml);

C# .NET 中的 PDF 到 PdfXML

要将 PDF 转换为 PdfXML 格式,您需要传递 SaveFormat.PdfXml 作为 Document.Save(string, SaveFormat) 方法的第二个参数。以下代码示例展示了如何在 C# 中将 PDF 转换为 PdfXML 格式。

// 加载 PDF 文档
var document = new Document("candy.pdf");

// 以 PdfXML 格式保存文档
document.Save("standard-xml-output.xml", SaveFormat.PdfXml);

C# PDF 到 XML 转换器 - 获得免费许可证

您可以获得免费的临时许可证 以便在没有评估限制的情况下使用 Aspose.PDF for .NET。

结论

在本文中,您学习了如何在 C# 中将 PDF 文档转换为 XML。此外,我们还明确介绍了如何以编程方式将 PDF 转换为 MobiXML 或 PdfXML 格式。此外,您可以使用 文档 探索有关 .NET PDF API 的更多信息。如果您有任何问题或疑问,可以通过我们的 论坛 与我们联系。

也可以看看