
当您需要将表格中的数据从 PDF 导出到 Excel 工作簿时,可能会有多种情况。 PDF to Excel 允许您编辑数据、应用公式、绘制图表以及执行电子表格支持的其他操作。在本文中,我将向您展示如何使用 Java 以编程方式自动执行 PDF 到 Excel 的转换以及将 PDF 转换为 XLS 到 XLSX 工作簿。为此,我们将利用 Aspose.PDF for Java API 的功能。
Java PDF 到 Excel 转换器 - 安装
Aspose.PDF for Java 可作为 JAR 文件 下载。此外,您可以使用以下配置将其安装在基于 Maven 的应用程序中。
存储库:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
依赖:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>20.5</version>
<classifier>jdk17</classifier>
</dependency>
使用 Java 将 PDF 转换为 Excel XLS
为了将 PDF 转换为 Excel XLS,您只需加载 PDF 文档并使用 .xls 扩展名保存它。以下是执行此转换的步骤。
- 使用 Document 类加载 PDF 文件。
- 使用 Document.save(String outputFileName, int format) 方法将 PDF 保存为 Excel XLS。
以下代码示例展示了如何使用 Java 将 PDF 转换为 Excel XLS。
// 加载源 PDF 文件
Document doc = new Document("sampletable.pdf");
// 将 PDF 转换为 XLS
doc.save("workbook.xls", SaveFormat.Excel);
输入 PDF 文件

输出 Excel 电子表格

使用 Java 将 PDF 转换为 Excel XLSX
要将 PDF 转换为 XLSX 电子表格,您需要使用 ExcelSaveOptions 类定义输出 Excel 格式。以下是使用 Aspose.PDF for Java 执行 PDF 到 XLSX 转换的步骤。
- 使用 Document 类加载输入的 PDF 文档。
- 创建 ExcelSaveOptions 类的实例。
- 使用 ExcelSaveOptions.setFormat(ExcelSaveOptions.ExcelFormat.XLSX) 方法设置输出格式。
- 使用 Document.save(String outputFileName, SaveOptions options) 方法将 PDF 转换为 Excel。
以下代码示例展示了如何使用 Java 将 PDF 转换为 XLSX。
// 加载源 PDF 文件
Document doc = new Document("sampletable.pdf");
// 设置 Excel 选项
ExcelSaveOptions options = new ExcelSaveOptions();
// 设置输出格式
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// 将 PDF 转换为 XLSX
doc.save("workbook.xlsx", options);
最小化 PDF 到 Excel 中的工作表数量
默认情况下,Aspose.PDF 将 PDF 文档中的每一页转换为单独的工作表。但是,您可以自定义 API 以在大型 PDF 文档的情况下最大限度地减少工作表的数量。以下是执行此操作的步骤。
- 使用 Document 类加载输入的 PDF 文档。
- 创建 ExcelSaveOptions 类的实例。
- 设置选项 ExcelSaveOptions.setMinimizeTheNumberOfWorksheets(true)。
- 将 PDF 保存为 XLSX。
以下代码示例显示了如何使用 Java 将 PDF 转换为 XLSX,并使用最少的工作表。
// 加载源 PDF 文件
Document doc = new Document("sampletable.pdf");
// 设置 Excel 选项
ExcelSaveOptions options = new ExcelSaveOptions();
// 设置输出格式
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// 设置最小化选项
options.setMinimizeTheNumberOfWorksheets(true);
// 将 PDF 转换为 Excel XLSX
doc.save("workbook.xlsx", options);
结论
在本文中,您了解了如何使用 Java 将 PDF 转换为 Excel XLS 或 XLSX 文件。此外,还借助代码示例讨论了将 PDF 到 Excel 中的工作表数量最小化的功能。您可以使用 文档 探索更多关于 Aspose.PDF for Java 的信息。