当您需要将表格数据从 PDF 文档导出到电子表格时,将 PDF 文件转换为 Excel 格式变得必不可少。作为程序员,您经常会得到 PDF 格式的表格数据,要处理这些数据,必须将其转换为 Excel 格式。因此,让我们看看如何在 .NET 应用程序中以编程方式执行此操作。阅读本文后,您将能够在 C# .NET 中将 PDF 转换为 Excel XLS 或 XLSX。
本文涵盖以下 PDF 到 Excel 的转换。
- C# .NET PDF 到 Excel 转换器
- 在 C# 中将 PDF 转换为 XLS
- 在 C# 中将 PDF 转换为 XLSX
- 将 PDF 导出到 Excel - 插入空白的第一列
- 将 PDF 另存为 Excel XLS - 最小化工作表数量
C# .NET PDF 到 Excel 转换器 - 免费下载
为了在 C# 中将 PDF 文件转换为 Excel XLS/XLS,我们将使用 Aspose.PDF for .NET。该 API 支持创建和操作 PDF 文档以及将 PDF 文件高保真地转换为其他格式。您可以 下载 它的 DLL 或使用以下方法之一从 NuGet 安装它。
PDF 到 Excel 转换器 - 通过 NuGet 包管理器安装
- 在 Visual Studio 中打开/创建项目。
- 转到 NuGet 包管理器并搜索 Aspose.PDF。
- 安装 API。
通过包管理器控制台安装
PM> Install-Package Aspose.PDF
在 C# 中将 PDF 转换为 Excel XLS
要将 PDF 文档转换为 XLS 电子表格,您只需加载 PDF 文件并使用“.xls”扩展名保存即可。以下是执行此转换的步骤。
- 使用 Document 类加载 PDF 文件。
- 创建 ExcelSaveOptions 类的对象。
- 使用 Document.Save(string, ExcelSaveOptions) 方法将 PDF 文件保存为 Excel XLS。
以下代码示例显示了如何在 C# 中将 PDF 转换为 Excel XLS。
// 载入PDF文件
Document pdfDocument = new Document("sampletable.pdf");
ExcelSaveOptions options = new ExcelSaveOptions();
// 保存输出文件
pdfDocument.Save("Excel.xls", options);
输入PDF文档
转换后的 Excel XLS
在 C# 中将 PDF 转换为 XLSX
默认情况下,Aspose.PDF 将 PDF 文档转换为 XLS 格式。如果您想获得 XLSX 格式的转换后的 Excel 电子表格,您可以使用 ExcelSaveOptions 类指定它。
以下代码示例显示如何使用 C# 将 PDF 文档转换为 XLSX 格式的 Excel。
// 载入PDF文件
Document pdfDocument = new Document("sampletable.pdf");
// 初始化 ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// 设置输出格式
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// 保存输出文件
pdfDocument.Save("Excel.xlsx", options);
C# 将 PDF 导出到 Excel - 第一列空白
您还可以在转换后的 Excel 电子表格中插入空白的第一列。这可以使用 ExcelSaveOptions.InsertBlankColumnAtFirst 选项来完成。
- 使用 Document 类加载 PDF 文件。
- 创建 ExcelSaveOptions 类的对象。
- (可选)使用 ExcelSaveOptions.Format 属性将输出 Excel 格式设置为 XLSX。
- 将 ExcelSaveOptions.InsertBlankColumnAtFirst 属性设置为 true。
- 使用 Document.Save(string, ExcelSaveOptions) 方法以 Excel 格式保存 PDF 文件。
以下代码示例显示如何在 PDF 到 Excel 转换中添加空白的第一列。
// 载入PDF文件
Document pdfDocument = new Document("sampletable.pdf");
// 初始化 ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// 设置输出格式
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// 将空白列作为第一列插入工作表
options.InsertBlankColumnAtFirst = true;
// 保存输出文件
pdfDocument.Save("Excel.xlsx", options);
在 C# 中将 PDF 另存为 XLS - 最小化页数
默认情况下,输入 PDF 文档中的每一页都会转换为单独的工作表。对于页数较多的大型 PDF 文档,转换后的 Excel 电子表格也会包含多个工作表。在这种情况下,您可以自定义 PDF 到 Excel 的转换,并最大限度地减少转换电子表格中的工作表数量。以下是执行此自定义的步骤。
- 使用 Document 类加载 PDF 文件。
- 创建 ExcelSaveOptions 类的对象。
- (可选)使用 ExcelSaveOptions.Format 属性将输出 Excel 格式设置为 XLSX。
- 将 ExcelSaveOptions.MinimizeTheNumberOfWorksheets 属性设置为 true。
- 使用 Document.Save(string, ExcelSaveOptions) 方法将 PDF 文件保存为 XLS/XLSX。
以下代码示例显示了如何在 C# 中最大限度地减少 PDF 到 Excel 转换中的工作表数量。
// 载入PDF文件
Document pdfDocument = new Document("sampletable.pdf");
// 初始化 ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// 设置输出格式
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// 最小化工作表的数量
options.MinimizeTheNumberOfWorksheets = true;
// 保存输出文件
pdfDocument.Save("Excel.xlsx", options);
PDF 到 Excel C# 转换器库 - 获取免费许可证
您可以 [获得免费的临时许可证][17] 将 PDF 文件转换为 Excel 格式,而没有评估限制。
阅读更多
如果您有兴趣探索 Aspose.PDF 的其他功能,请访问 此处 的文档。
结论
在本文中,您了解了如何在 C# 中以编程方式将 PDF 文件转换为 Excel 格式。此外,您还看到了如何使用不同的选项自定义转换。您可以轻松地将提供的代码示例集成到您的 .NET 应用程序中。