當您需要將表格中的數據從 PDF 導出到 Excel 工作簿時,可能會出現各種情況。 PDF 到 Excel 允許您編輯數據、應用公式、繪製圖表以及執行電子表格支持的其他操作。在本文中,我將向您展示如何使用 Java 以編程方式自動將 PDF 轉換為 Excel 以及將 PDF 轉換為 XLS 到 XLSX 工作簿。為此,我們將利用 Aspose.PDF for Java API 的功能。
Java PDF 到 Excel 轉換器 - 安裝
Aspose.PDF for Java 可作為 JAR 文件下載使用。此外,您可以使用以下配置將它安裝在基於 Maven 的應用程序中。
存儲庫:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
依賴:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>20.5</version>
<classifier>jdk17</classifier>
</dependency>
使用 Java 將 PDF 轉換為 Excel XLS
為了將 PDF 轉換為 Excel XLS,您只需加載 PDF 文檔並將其保存為 .xls 擴展名。以下是執行此轉換的步驟。
- 使用 Document 類加載 PDF 文件。
- 使用 Document.save(String outputFileName, int format) 方法將 PDF 保存為 Excel XLS。
以下代碼示例顯示瞭如何使用 Java 將 PDF 轉換為 Excel XLS。
// 加載源 PDF 文件
Document doc = new Document("sampletable.pdf");
// 將 PDF 轉換為 XLS
doc.save("workbook.xls", SaveFormat.Excel);
輸入PDF文檔
輸出 Excel 電子表格
使用 Java 將 PDF 轉換為 Excel XLSX
要將 PDF 轉換為 XLSX 電子表格,您需要使用 ExcelSaveOptions 類定義輸出 Excel 格式。以下是使用 Aspose.PDF for Java 執行 PDF 到 XLSX 轉換的步驟。
- 使用 Document 類加載輸入 PDF 文檔。
- 創建 ExcelSaveOptions 類的實例。
- 使用 ExcelSaveOptions.setFormat(ExcelSaveOptions.ExcelFormat.XLSX) 方法設置輸出格式。
- 使用 Document.save(String outputFileName, SaveOptions options) 方法將 PDF 轉換為 Excel。
以下代碼示例顯示瞭如何使用 Java 將 PDF 轉換為 XLSX。
// 加載源 PDF 文件
Document doc = new Document("sampletable.pdf");
// 設置 Excel 選項
ExcelSaveOptions options = new ExcelSaveOptions();
// 設置輸出格式
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// 將 PDF 轉換為 XLSX
doc.save("workbook.xlsx", options);
盡量減少 PDF 到 Excel 中的工作表數量
默認情況下,Aspose.PDF 將 PDF 文檔中的每一頁轉換為單獨的工作表。但是,您可以自定義 API 以在大型 PDF 文檔的情況下最大限度地減少工作表的數量。以下是執行此操作的步驟。
- 使用 Document 類加載輸入的 PDF 文檔。
- 創建 ExcelSaveOptions 類的實例。
- 設置選項 ExcelSaveOptions.setMinimizeTheNumberOfWorksheets(true)。
- 將 PDF 另存為 XLSX。
以下代碼示例展示瞭如何使用 Java 將 PDF 轉換為 XLSX,同時使用最少的工作表。
// 加載源 PDF 文件
Document doc = new Document("sampletable.pdf");
// 設置 Excel 選項
ExcelSaveOptions options = new ExcelSaveOptions();
// 設置輸出格式
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// 設置最小化選項
options.setMinimizeTheNumberOfWorksheets(true);
// 將 PDF 轉換為 Excel XLSX
doc.save("workbook.xlsx", options);
結論
在本文中,您了解瞭如何使用 Java 將 PDF 轉換為 Excel XLS 或 XLSX 文件。此外,還在代碼示例的幫助下討論了將 PDF 中的工作表數量最小化到 Excel 的功能。您可以使用 文檔 探索更多關於 Aspose.PDF for Java 的信息。