Могут быть различные сценарии, когда вам нужно экспортировать данные в таблицах из PDF в книги Excel. PDF в Excel позволяет редактировать данные, применять формулы, строить диаграммы и выполнять другие операции, поддерживаемые электронными таблицами. В этой статье я покажу вам, как автоматизировать преобразование PDF в Excel и преобразовать книги PDF в XLS в XLSX программно с помощью Java. Для этого мы воспользуемся возможностями Aspose.PDF for Java API.
- API конвертера PDF в Excel — установка
- Преобразование PDF в XLS с помощью Java
- Преобразование PDF в XLSX с помощью Java
- PDF в Excel — сведите к минимуму количество рабочих листов
Конвертер Java PDF в Excel - Установка
Aspose.PDF для Java доступен для скачивания в виде файла JAR. Кроме того, вы можете установить его в свои приложения на основе Maven, используя следующие конфигурации.
Репозиторий:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
Зависимость:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>20.5</version>
<classifier>jdk17</classifier>
</dependency>
Преобразование PDF в Excel XLS с помощью Java
Чтобы преобразовать PDF в Excel XLS, вам просто нужно загрузить PDF-документ и сохранить его с расширением .xls. Ниже приведены шаги для выполнения этого преобразования.
- Загрузите файл PDF с помощью класса Document.
- Сохраните PDF как Excel XLS, используя метод Document.save(String outputFileName, int format).
В следующем примере кода показано, как преобразовать PDF в Excel XLS с помощью Java.
// Загрузить исходный PDF-файл
Document doc = new Document("sampletable.pdf");
// Преобразование PDF в XLS
doc.save("workbook.xls", SaveFormat.Excel);
Входной PDF-документ
Выходная таблица Excel
Преобразование PDF в Excel XLSX с помощью Java
Для преобразования PDF в электронную таблицу XLSX вам необходимо определить выходной формат Excel с помощью класса ExcelSaveOptions. Ниже приведены шаги для преобразования PDF в XLSX с использованием Aspose.PDF для Java.
- Загрузите входной PDF-документ с помощью класса Document.
- Создайте экземпляр класса ExcelSaveOptions.
- Установите выходной формат с помощью метода ExcelSaveOptions.setFormat(ExcelSaveOptions.ExcelFormat.XLSX).
- Преобразуйте PDF в Excel, используя метод Document.save(String outputFileName, SaveOptions options).
В следующем примере кода показано, как преобразовать PDF в XLSX с помощью Java.
// Загрузить исходный PDF-файл
Document doc = new Document("sampletable.pdf");
// Установить параметры Excel
ExcelSaveOptions options = new ExcelSaveOptions();
// Установить выходной формат
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// Конвертировать PDF в XLSX
doc.save("workbook.xlsx", options);
Минимизируйте количество рабочих листов в PDF в Excel
По умолчанию Aspose.PDF преобразует каждую страницу документа PDF в отдельный рабочий лист. Однако вы можете настроить API, чтобы свести к минимуму количество рабочих листов в случае больших PDF-документов. Ниже приведены шаги для выполнения этой операции.
- Используйте класс Document для загрузки входного PDF-документа.
- Создайте экземпляр класса ExcelSaveOptions.
- Установите параметр ExcelSaveOptions.setMinimizeTheNumberOfWorksheets(true).
- Сохраните PDF как XLSX.
В следующем примере кода показано, как преобразовать PDF в XLSX с минимальным количеством рабочих листов с помощью Java.
// Загрузить исходный PDF-файл
Document doc = new Document("sampletable.pdf");
// Установить параметры Excel
ExcelSaveOptions options = new ExcelSaveOptions();
// Установить выходной формат
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// Установите параметр минимизации
options.setMinimizeTheNumberOfWorksheets(true);
// Преобразование PDF в Excel XLSX
doc.save("workbook.xlsx", options);
Вывод
В этой статье вы увидели, как конвертировать PDF в файлы Excel XLS или XLSX с помощью Java. Кроме того, функция минимизации количества рабочих листов в PDF to Excel также обсуждается с помощью примера кода. Вы можете узнать больше об Aspose.PDF для Java, используя документацию.