Преобразование файлов PDF в формат Excel становится необходимым, когда вам нужно экспортировать табличные данные из документов PDF в электронные таблицы. Как программист, вы часто получаете табличные данные в формате PDF, и для обработки этих данных их необходимо преобразовать в формат Excel. Итак, давайте посмотрим, как это сделать программно из приложений .NET. Прочитав эту статью, вы сможете конвертировать PDF в Excel XLS или XLSX в C# .NET.
В этой статье рассматриваются следующие преобразования PDF в Excel.
- Конвертер C# .NET PDF в Excel
- Преобразование PDF в XLS на C#
- Преобразование PDF в XLSX на С#
- Экспорт PDF в Excel - Вставить пустой первый столбец
- Сохранить PDF как Excel XLS — минимизировать количество листов
Конвертер C# .NET PDF в Excel — скачать бесплатно
Для преобразования PDF-файла в Excel XLS/XLS на C# мы будем использовать Aspose.PDF for .NET. API поддерживает создание документов PDF и управление ими, а также преобразование файлов PDF в другие форматы с высокой точностью. Вы можете либо скачать его DLL, либо установить его из NuGet одним из следующих способов.
Конвертер PDF в Excel — установка с помощью диспетчера пакетов NuGet
- Откройте/создайте проект в Visual Studio.
- Перейдите в диспетчер пакетов NuGet и выполните поиск Aspose.PDF.
- Установите API.
Установить через консоль диспетчера пакетов
PM> Install-Package Aspose.PDF
Преобразование PDF в Excel XLS в C#
Чтобы преобразовать документ PDF в электронную таблицу XLS, вы можете просто загрузить файл PDF и сохранить его с расширением «.xls». Ниже приведены шаги для выполнения этого преобразования.
- Загрузите файл PDF, используя класс Document.
- Создайте объект класса ExcelSaveOptions.
- Сохраните PDF-файл как Excel XLS, используя метод Document.Save(string, ExcelSaveOptions).
В следующем примере кода показано, как преобразовать PDF в Excel XLS на C#.
// Загрузить PDF-документ
Document pdfDocument = new Document("sampletable.pdf");
ExcelSaveOptions options = new ExcelSaveOptions();
// Сохранить выходной файл
pdfDocument.Save("Excel.xls", options);
Входной PDF-документ
Преобразованный Excel XLS
Преобразование PDF в XLSX на C#
По умолчанию Aspose.PDF преобразует документ PDF в формат XLS. Если вы хотите получить преобразованную электронную таблицу Excel в формате XLSX, вы можете указать ее с помощью класса ExcelSaveOptions.
В следующем примере кода показано, как преобразовать документ PDF в Excel в формате XLSX с помощью C#.
// Загрузить PDF-документ
Document pdfDocument = new Document("sampletable.pdf");
// Инициализировать ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Установить выходной формат
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Сохранить выходной файл
pdfDocument.Save("Excel.xlsx", options);
С# Экспорт PDF в Excel — пустой первый столбец
Вы также можете вставить пустой первый столбец в преобразованную электронную таблицу Excel. Это можно сделать с помощью опции ExcelSaveOptions.InsertBlankColumnAtFirst.
- Загрузите файл PDF, используя класс Document.
- Создайте объект класса ExcelSaveOptions.
- (Необязательно) Установите для выходного формата Excel значение XLSX, используя свойство ExcelSaveOptions.Format.
- Задайте для свойства ExcelSaveOptions.InsertBlankColumnAtFirst значение true.
- Сохраните файл PDF в формате Excel, используя метод Document.Save(string, ExcelSaveOptions).
В следующем примере кода показано, как добавить пустой первый столбец при преобразовании PDF в Excel.
// Загрузить PDF-документ
Document pdfDocument = new Document("sampletable.pdf");
// Инициализировать ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Установить выходной формат
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Чтобы вставить пустой столбец в качестве первого столбца на рабочий лист
options.InsertBlankColumnAtFirst = true;
// Сохранить выходной файл
pdfDocument.Save("Excel.xlsx", options);
Сохранить PDF как XLS в С# — минимальное количество листов
По умолчанию каждая страница входного PDF-документа преобразуется в отдельный рабочий лист. Для больших PDF-документов с несколькими страницами преобразованная электронная таблица Excel также будет содержать несколько рабочих листов. В таком случае вы можете настроить преобразование PDF в Excel и минимизировать количество рабочих листов в преобразованной электронной таблице. Ниже приведены шаги для выполнения этой настройки.
- Загрузите файл PDF, используя класс Document.
- Создайте объект класса ExcelSaveOptions.
- (Необязательно) Установите для выходного формата Excel значение XLSX, используя свойство ExcelSaveOptions.Format.
- Задайте для свойства ExcelSaveOptions.MinimizeTheNumberOfWorksheets значение true.
- Сохраните файл PDF в формате XLS/XLSX, используя метод Document.Save(string, ExcelSaveOptions).
В следующем примере кода показано, как минимизировать количество рабочих листов при преобразовании PDF в Excel на C#.
// Загрузить PDF-документ
Document pdfDocument = new Document("sampletable.pdf");
// Инициализировать ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Установить выходной формат
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Свести к минимуму количество рабочих листов
options.MinimizeTheNumberOfWorksheets = true;
// Сохранить выходной файл
pdfDocument.Save("Excel.xlsx", options);
Библиотека конвертера PDF в Excel C# - Получите бесплатную лицензию
Вы можете [получить бесплатную временную лицензию][17] для преобразования PDF-файлов в формат Excel без ограничений пробной версии.
Читать далее
Если вы заинтересованы в изучении других функций Aspose.PDF, посетите документацию здесь.
Вывод
В этой статье вы узнали, как программно преобразовать PDF-файлы в форматы Excel на C#. Кроме того, вы увидели, как настроить преобразование, используя различные параметры. Вы можете легко интегрировать предоставленный образец кода в свои приложения .NET.