テーブル内のデータをPDFからExcelブックにエクスポートする必要がある場合、さまざまなシナリオが考えられます。 PDF to Excelを使用すると、データの編集、数式の適用、グラフのプロット、およびスプレッドシートでサポートされているその他の操作を実行できます。この記事では、Javaを使用してPDFからExcelへの変換を自動化し、PDFからXLS、XLSXワークブックにプログラムで変換する方法を紹介します。このために、Aspose.PDF for JavaAPIの機能を活用します。
- PDF to ExcelConverterAPI-インストール
- Javaを使用してPDFをXLSに変換する
- Javaを使用してPDFをXLSXに変換する
- PDFからExcelへ-ワークシートの数を最小限に抑える
Java PDF toExcelConverter-インストール
Aspose.PDF for JavaはダウンロードでJARファイルとして利用できます。さらに、以下の構成を使用して、Mavenベースのアプリケーションにインストールできます。
リポジトリ:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
依存:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>20.5</version>
<classifier>jdk17</classifier>
</dependency>
Javaを使用してPDFをExcelXLSに変換する
PDFをExcelXLSに変換するには、PDFドキュメントをロードし、.xls拡張子を付けて保存するだけです。この変換を実行する手順は次のとおりです。
- Documentクラスを使用してPDFファイルをロードします。
- Document.save(String outputFileName, int format)メソッドを使用して、PDFをExcelXLSとして保存します。
次のコードサンプルは、Javaを使用してPDFをExcelXLSに変換する方法を示しています。
// ソースPDFファイルをロード
Document doc = new Document("sampletable.pdf");
// PDFをXLSに変換する
doc.save("workbook.xls", SaveFormat.Excel);
PDFドキュメントを入力
Excelスプレッドシートを出力する
Javaを使用してPDFをExcelXLSXに変換する
PDFをXLSXスプレッドシートに変換するには、ExcelSaveOptionsクラスを使用して出力Excel形式を定義する必要があります。以下は、Aspose.PDFforJavaを使用してPDFからXLSXへの変換を実行する手順です。
- Documentクラスを使用して入力PDFドキュメントをロードします。
- ExcelSaveOptionsクラスのインスタンスを作成します。
- ExcelSaveOptions.setFormat(ExcelSaveOptions.ExcelFormat.XLSX)メソッドを使用して出力形式を設定します。
- Document.save(String outputFileName, SaveOptions options)メソッドを使用してPDFをExcelに変換します。
次のコードサンプルは、Javaを使用してPDFをXLSXに変換する方法を示しています。
// ソースPDFファイルをロード
Document doc = new Document("sampletable.pdf");
// Excelオプションを設定する
ExcelSaveOptions options = new ExcelSaveOptions();
// 出力形式を設定する
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// PDFをXLSXに変換する
doc.save("workbook.xlsx", options);
PDFからExcelへのワークシートの数を最小限に抑える
デフォルトでは、Aspose.PDFはPDFドキュメントの各ページを個別のワークシートに変換します。ただし、大きなPDFドキュメントの場合は、APIをカスタマイズしてワークシートの数を最小限に抑えることができます。この操作を実行する手順は次のとおりです。
- Documentクラスを使用して、入力PDFドキュメントをロードします。
- ExcelSaveOptionsクラスのインスタンスを作成します。
- オプションExcelSaveOptions.setMinimizeTheNumberOfWorksheets(true)を設定します。
- PDFをXLSXとして保存します。
次のコードサンプルは、Javaを使用して最小数のワークシートでPDFをXLSXに変換する方法を示しています。
// ソースPDFファイルをロード
Document doc = new Document("sampletable.pdf");
// Excelオプションを設定する
ExcelSaveOptions options = new ExcelSaveOptions();
// 出力形式を設定する
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// 最小化オプションを設定する
options.setMinimizeTheNumberOfWorksheets(true);
// PDFをExcelXLSXに変換する
doc.save("workbook.xlsx", options);
結論
この記事では、Javaを使用してPDFをExcelXLSまたはXLSXファイルに変換する方法を見てきました。さらに、PDFからExcelへのワークシートの数を最小限に抑える機能についても、コードサンプルを使用して説明します。 ドキュメントを使用して、Aspose.PDFforJavaの詳細を調べることができます。