PDF 到 Excel Java

当您需要将表格中的数据从 PDF 导出到 Excel 工作簿时,可能会有多种情况。 PDF to Excel 允许您编辑数据、应用公式、绘制图表以及执行电子表格支持的其他操作。在本文中,我将向您展示如何使用 Java 以编程方式自动执行 PDF 到 Excel 的转换以及将 PDF 转换为 XLS 到 XLSX 工作簿。为此,我们将利用 Aspose.PDF for Java API 的功能。

Java PDF 到 Excel 转换器 - 安装

Aspose.PDF for Java 可作为 JAR 文件 下载。此外,您可以使用以下配置将其安装在基于 Maven 的应用程序中。

存储库:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

依赖:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>20.5</version>
    <classifier>jdk17</classifier>
</dependency>

使用 Java 将 PDF 转换为 Excel XLS

为了将 PDF 转换为 Excel XLS,您只需加载 PDF 文档并使用 .xls 扩展名保存它。以下是执行此转换的步骤。

以下代码示例展示了如何使用 Java 将 PDF 转换为 Excel XLS。

// 加载源 PDF 文件
Document doc = new Document("sampletable.pdf");
// 将 PDF 转换为 XLS
doc.save("workbook.xls", SaveFormat.Excel);

输入 PDF 文件

将 PDF 转换为 Excel

输出 Excel 电子表格

PDF 转 XLS XLSX

使用 Java 将 PDF 转换为 Excel XLSX

要将 PDF 转换为 XLSX 电子表格,您需要使用 ExcelSaveOptions 类定义输出 Excel 格式。以下是使用 Aspose.PDF for Java 执行 PDF 到 XLSX 转换的步骤。

以下代码示例展示了如何使用 Java 将 PDF 转换为 XLSX。

// 加载源 PDF 文件
Document doc = new Document("sampletable.pdf");
// 设置 Excel 选项
ExcelSaveOptions options = new ExcelSaveOptions();
// 设置输出格式
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// 将 PDF 转换为 XLSX
doc.save("workbook.xlsx", options);

最小化 PDF 到 Excel 中的工作表数量

默认情况下,Aspose.PDF 将 PDF 文档中的每一页转换为单独的工作表。但是,您可以自定义 API 以在大型 PDF 文档的情况下最大限度地减少工作表的数量。以下是执行此操作的步骤。

以下代码示例显示了如何使用 Java 将 PDF 转换为 XLSX,并使用最少的工作表。

// 加载源 PDF 文件
Document doc = new Document("sampletable.pdf");
// 设置 Excel 选项
ExcelSaveOptions options = new ExcelSaveOptions();
// 设置输出格式
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// 设置最小化选项
options.setMinimizeTheNumberOfWorksheets(true);
// 将 PDF 转换为 Excel XLSX
doc.save("workbook.xlsx", options);

结论

在本文中,您了解了如何使用 Java 将 PDF 转换为 Excel XLS 或 XLSX 文件。此外,还借助代码示例讨论了将 PDF 到 Excel 中的工作表数量最小化的功能。您可以使用 文档 探索更多关于 Aspose.PDF for Java 的信息。

也可以看看