PDF в Excel Java

Могут быть различные сценарии, когда вам нужно экспортировать данные в таблицах из PDF в книги Excel. PDF в Excel позволяет редактировать данные, применять формулы, строить диаграммы и выполнять другие операции, поддерживаемые электронными таблицами. В этой статье я покажу вам, как автоматизировать преобразование PDF в Excel и преобразовать книги PDF в XLS в XLSX программно с помощью Java. Для этого мы воспользуемся возможностями Aspose.PDF for Java API.

Конвертер Java PDF в Excel - Установка

Aspose.PDF для Java доступен для скачивания в виде файла JAR. Кроме того, вы можете установить его в свои приложения на основе Maven, используя следующие конфигурации.

Репозиторий:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Зависимость:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>20.5</version>
    <classifier>jdk17</classifier>
</dependency>

Преобразование PDF в Excel XLS с помощью Java

Чтобы преобразовать PDF в Excel XLS, вам просто нужно загрузить PDF-документ и сохранить его с расширением .xls. Ниже приведены шаги для выполнения этого преобразования.

В следующем примере кода показано, как преобразовать PDF в Excel XLS с помощью Java.

// Загрузить исходный PDF-файл
Document doc = new Document("sampletable.pdf");
// Преобразование PDF в XLS
doc.save("workbook.xls", SaveFormat.Excel);

Входной PDF-документ

Преобразование PDF в Excel

Выходная таблица Excel

PDF в XLS XLSX

Преобразование PDF в Excel XLSX с помощью Java

Для преобразования PDF в электронную таблицу XLSX вам необходимо определить выходной формат Excel с помощью класса ExcelSaveOptions. Ниже приведены шаги для преобразования PDF в XLSX с использованием Aspose.PDF для Java.

В следующем примере кода показано, как преобразовать PDF в XLSX с помощью Java.

// Загрузить исходный PDF-файл
Document doc = new Document("sampletable.pdf");
// Установить параметры Excel
ExcelSaveOptions options = new ExcelSaveOptions();
// Установить выходной формат
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// Конвертировать PDF в XLSX
doc.save("workbook.xlsx", options);

Минимизируйте количество рабочих листов в PDF в Excel

По умолчанию Aspose.PDF преобразует каждую страницу документа PDF в отдельный рабочий лист. Однако вы можете настроить API, чтобы свести к минимуму количество рабочих листов в случае больших PDF-документов. Ниже приведены шаги для выполнения этой операции.

В следующем примере кода показано, как преобразовать PDF в XLSX с минимальным количеством рабочих листов с помощью Java.

// Загрузить исходный PDF-файл
Document doc = new Document("sampletable.pdf");
// Установить параметры Excel
ExcelSaveOptions options = new ExcelSaveOptions();
// Установить выходной формат
options.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// Установите параметр минимизации
options.setMinimizeTheNumberOfWorksheets(true);
// Преобразование PDF в Excel XLSX
doc.save("workbook.xlsx", options);

Вывод

В этой статье вы увидели, как конвертировать PDF в файлы Excel XLS или XLSX с помощью Java. Кроме того, функция минимизации количества рабочих листов в PDF to Excel также обсуждается с помощью примера кода. Вы можете узнать больше об Aspose.PDF для Java, используя документацию.

Смотрите также