在 C# .NET 中将 PDF 转换为 XLS

当您需要将表格数据从 PDF 文档导出到电子表格时,将 PDF 文件转换为 Excel 格式变得必不可少。作为程序员,您经常会得到 PDF 格式的表格数据,要处理这些数据,必须将其转换为 Excel 格式。因此,让我们看看如何在 .NET 应用程序中以编程方式执行此操作。阅读本文后,您将能够在 C# .NET 中将 PDF 转换为 Excel XLS 或 XLSX。

本文涵盖以下 PDF 到 Excel 的转换。

C# .NET PDF 到 Excel 转换器 - 免费下载

为了在 C# 中将 PDF 文件转换为 Excel XLS/XLS,我们将使用 Aspose.PDF for .NET。该 API 支持创建和操作 PDF 文档以及将 PDF 文件高保真地转换为其他格式。您可以 下载 它的 DLL 或使用以下方法之一从 NuGet 安装它。

PDF 到 Excel 转换器 - 通过 NuGet 包管理器安装

  • 在 Visual Studio 中打开/创建项目。
  • 转到 NuGet 包管理器并搜索 Aspose.PDF。
  • 安装 API。

通过包管理器控制台安装

PM> Install-Package Aspose.PDF

在 C# 中将 PDF 转换为 Excel XLS

要将 PDF 文档转换为 XLS 电子表格,您只需加载 PDF 文件并使用“.xls”扩展名保存即可。以下是执行此转换的步骤。

  • 使用 Document 类加载 PDF 文件。
  • 创建 ExcelSaveOptions 类的对象。
  • 使用 Document.Save(string, ExcelSaveOptions) 方法将 PDF 文件保存为 Excel XLS。

以下代码示例显示了如何在 C# 中将 PDF 转换为 Excel XLS。

// 载入PDF文件
Document pdfDocument = new Document("sampletable.pdf");
ExcelSaveOptions options = new ExcelSaveOptions(); 
// 保存输出文件
pdfDocument.Save("Excel.xls", options);

输入PDF文档

转换后的 Excel XLS

在 C# 中将 PDF 转换为 XLSX

默认情况下,Aspose.PDF 将 PDF 文档转换为 XLS 格式。如果您想获得 XLSX 格式的转换后的 Excel 电子表格,您可以使用 ExcelSaveOptions 类指定它。

以下代码示例显示如何使用 C# 将 PDF 文档转换为 XLSX 格式的 Excel。

// 载入PDF文件
Document pdfDocument = new Document("sampletable.pdf");
// 初始化 ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// 设置输出格式
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// 保存输出文件
pdfDocument.Save("Excel.xlsx", options);

C# 将 PDF 导出到 Excel - 第一列空白

您还可以在转换后的 Excel 电子表格中插入空白的第一列。这可以使用 ExcelSaveOptions.InsertBlankColumnAtFirst 选项来完成。

  • 使用 Document 类加载 PDF 文件。
  • 创建 ExcelSaveOptions 类的对象。
  • (可选)使用 ExcelSaveOptions.Format 属性将输出 Excel 格式设置为 XLSX。
  • 将 ExcelSaveOptions.InsertBlankColumnAtFirst 属性设置为 true。
  • 使用 Document.Save(string, ExcelSaveOptions) 方法以 Excel 格式保存 PDF 文件。

以下代码示例显示如何在 PDF 到 Excel 转换中添加空白的第一列。

// 载入PDF文件
Document pdfDocument = new Document("sampletable.pdf");
// 初始化 ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// 设置输出格式
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// 将空白列作为第一列插入工作表 
options.InsertBlankColumnAtFirst = true;
// 保存输出文件
pdfDocument.Save("Excel.xlsx", options);

在 C# 中将 PDF 另存为 XLS - 最小化页数

默认情况下,输入 PDF 文档中的每一页都会转换为单独的工作表。对于页数较多的大型 PDF 文档,转换后的 Excel 电子表格也会包含多个工作表。在这种情况下,您可以自定义 PDF 到 Excel 的转换,并最大限度地减少转换电子表格中的工作表数量。以下是执行此自定义的步骤。

  • 使用 Document 类加载 PDF 文件。
  • 创建 ExcelSaveOptions 类的对象。
  • (可选)使用 ExcelSaveOptions.Format 属性将输出 Excel 格式设置为 XLSX。
  • 将 ExcelSaveOptions.MinimizeTheNumberOfWorksheets 属性设置为 true。
  • 使用 Document.Save(string, ExcelSaveOptions) 方法将 PDF 文件保存为 XLS/XLSX。

以下代码示例显示了如何在 C# 中最大限度地减少 PDF 到 Excel 转换中的工作表数量。

// 载入PDF文件
Document pdfDocument = new Document("sampletable.pdf");
// 初始化 ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// 设置输出格式
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// 最小化工作表的数量
options.MinimizeTheNumberOfWorksheets = true;
// 保存输出文件
pdfDocument.Save("Excel.xlsx", options);

PDF 到 Excel C# 转换器库 - 获取免费许可证

您可以 [获得免费的临时许可证][17] 将 PDF 文件转换为 Excel 格式,而没有评估限制。

阅读更多

如果您有兴趣探索 Aspose.PDF 的其他功能,请访问 此处 的文档。

结论

在本文中,您了解了如何在 C# 中以编程方式将 PDF 文件转换为 Excel 格式。此外,您还看到了如何使用不同的选项自定义转换。您可以轻松地将提供的代码示例集成到您的 .NET 应用程序中。

相关文章

使用 Java 将 PDF 文档转换为 Excel XLS/XLSX在 C# .NET 中以编程方式将 Word 文档转换为 PDFPython 中的 PDF 文件到文本
Java 中的 XLSX 到 JSON在 Java 中将 Excel 转换为 JSONJava 中的 DOCX 到 JSON
Java 中的 DOC 到 JSONJava 中的 Word 到 JSONJava 中的 TXT 到 JSON
Python 中的 JSON 到 PDF在 Java 中将 Excel 转换为 JSONPython 中的 TXT 到 JSON
使用 C# 将 Word 文档转换为 Markdown使用 Java 将 Word 文档转换为 Markdown在 Python 中将 Word 文档转换为 TIFF
在 Python 中将 Word 转换为 HTML使用 C# 将 Word 转换为 HTML使用 Java 将 Word 转换为 HTML
在 Python 中将 Word 转换为 Markdown