PDF в XLS на C# .NET

Преобразование файлов PDF в формат Excel становится необходимым, когда вам нужно экспортировать табличные данные из документов PDF в электронные таблицы. Как программист, вы часто получаете табличные данные в формате PDF, и для обработки этих данных их необходимо преобразовать в формат Excel. Итак, давайте посмотрим, как это сделать программно из приложений .NET. Прочитав эту статью, вы сможете конвертировать PDF в Excel XLS или XLSX в C# .NET.

В этой статье рассматриваются следующие преобразования PDF в Excel.

Конвертер C# .NET PDF в Excel — скачать бесплатно

Для преобразования PDF-файла в Excel XLS/XLS на C# мы будем использовать Aspose.PDF for .NET. API поддерживает создание документов PDF и управление ими, а также преобразование файлов PDF в другие форматы с высокой точностью. Вы можете либо скачать его DLL, либо установить его из NuGet одним из следующих способов.

Конвертер PDF в Excel — установка с помощью диспетчера пакетов NuGet

  • Откройте/создайте проект в Visual Studio.
  • Перейдите в диспетчер пакетов NuGet и выполните поиск Aspose.PDF.
  • Установите API.

Установить через консоль диспетчера пакетов

PM> Install-Package Aspose.PDF

Преобразование PDF в Excel XLS в C#

Чтобы преобразовать документ PDF в электронную таблицу XLS, вы можете просто загрузить файл PDF и сохранить его с расширением «.xls». Ниже приведены шаги для выполнения этого преобразования.

  • Загрузите файл PDF, используя класс Document.
  • Создайте объект класса ExcelSaveOptions.
  • Сохраните PDF-файл как Excel XLS, используя метод Document.Save(string, ExcelSaveOptions).

В следующем примере кода показано, как преобразовать PDF в Excel XLS на C#.

// Загрузить PDF-документ
Document pdfDocument = new Document("sampletable.pdf");
ExcelSaveOptions options = new ExcelSaveOptions(); 
// Сохранить выходной файл
pdfDocument.Save("Excel.xls", options);

Входной PDF-документ

Преобразованный Excel XLS

Преобразование PDF в XLSX на C#

По умолчанию Aspose.PDF преобразует документ PDF в формат XLS. Если вы хотите получить преобразованную электронную таблицу Excel в формате XLSX, вы можете указать ее с помощью класса ExcelSaveOptions.

В следующем примере кода показано, как преобразовать документ PDF в Excel в формате XLSX с помощью C#.

// Загрузить PDF-документ
Document pdfDocument = new Document("sampletable.pdf");
// Инициализировать ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Установить выходной формат
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Сохранить выходной файл
pdfDocument.Save("Excel.xlsx", options);

С# Экспорт PDF в Excel — пустой первый столбец

Вы также можете вставить пустой первый столбец в преобразованную электронную таблицу Excel. Это можно сделать с помощью опции ExcelSaveOptions.InsertBlankColumnAtFirst.

  • Загрузите файл PDF, используя класс Document.
  • Создайте объект класса ExcelSaveOptions.
  • (Необязательно) Установите для выходного формата Excel значение XLSX, используя свойство ExcelSaveOptions.Format.
  • Задайте для свойства ExcelSaveOptions.InsertBlankColumnAtFirst значение true.
  • Сохраните файл PDF в формате Excel, используя метод Document.Save(string, ExcelSaveOptions).

В следующем примере кода показано, как добавить пустой первый столбец при преобразовании PDF в Excel.

// Загрузить PDF-документ
Document pdfDocument = new Document("sampletable.pdf");
// Инициализировать ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Установить выходной формат
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Чтобы вставить пустой столбец в качестве первого столбца на рабочий лист 
options.InsertBlankColumnAtFirst = true;
// Сохранить выходной файл
pdfDocument.Save("Excel.xlsx", options);

Сохранить PDF как XLS в С# — минимальное количество листов

По умолчанию каждая страница входного PDF-документа преобразуется в отдельный рабочий лист. Для больших PDF-документов с несколькими страницами преобразованная электронная таблица Excel также будет содержать несколько рабочих листов. В таком случае вы можете настроить преобразование PDF в Excel и минимизировать количество рабочих листов в преобразованной электронной таблице. Ниже приведены шаги для выполнения этой настройки.

  • Загрузите файл PDF, используя класс Document.
  • Создайте объект класса ExcelSaveOptions.
  • (Необязательно) Установите для выходного формата Excel значение XLSX, используя свойство ExcelSaveOptions.Format.
  • Задайте для свойства ExcelSaveOptions.MinimizeTheNumberOfWorksheets значение true.
  • Сохраните файл PDF в формате XLS/XLSX, используя метод Document.Save(string, ExcelSaveOptions).

В следующем примере кода показано, как минимизировать количество рабочих листов при преобразовании PDF в Excel на C#.

// Загрузить PDF-документ
Document pdfDocument = new Document("sampletable.pdf");
// Инициализировать ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Установить выходной формат
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Свести к минимуму количество рабочих листов
options.MinimizeTheNumberOfWorksheets = true;
// Сохранить выходной файл
pdfDocument.Save("Excel.xlsx", options);

Библиотека конвертера PDF в Excel C# - Получите бесплатную лицензию

Вы можете [получить бесплатную временную лицензию][17] для преобразования PDF-файлов в формат Excel без ограничений пробной версии.

Читать далее

Если вы заинтересованы в изучении других функций Aspose.PDF, посетите документацию здесь.

Вывод

В этой статье вы узнали, как программно преобразовать PDF-файлы в форматы Excel на C#. Кроме того, вы увидели, как настроить преобразование, используя различные параметры. Вы можете легко интегрировать предоставленный образец кода в свои приложения .NET.

Статьи по Теме

[Документы PDF в Excel XLS/XLSX с использованием Java] (https://blog.aspose.com/ru/pdf/convert-pdf-to-excel-xls-xlsx-using-java/)Программное преобразование документов Word в PDF на C# .NET[PDF-файл в текст на Python] (https://blog.aspose.com/convert-pdf-to-text-in-python/)
[XLSX в JSON на Java] (https://blog.aspose.com/ru/cells/convert-xlsx-to-json-in-java/)[Excel в JSON на Java] (https://blog.aspose.com/ru/cells/convert-xls-to-json-in-java/)[DOCX в JSON на Java] (https://blog.aspose.com/ru/total/convert-docx-to-json-in-java/)
[DOC в JSON на Java] (https://blog.aspose.com/total/convert-doc-to-json-in-java/)[Слово в JSON в Java] (https://blog.aspose.com/total/convert-word-to-json-in-java/)[TXT в JSON на Java] (https://blog.aspose.com/ru/cells/convert-txt-to-json-in-java/)
[JSON в PDF на Python] (https://blog.aspose.com/ru/cells/convert-json-to-pdf-in-python/)[Excel в JSON на Java] (https://blog.aspose.com/ru/cells/convert-xls-to-json-in-java/)[TXT в JSON на Python] (https://blog.aspose.com/ru/cells/convert-txt-to-json-in-python/)
Преобразование документов Word в Markdown с помощью C#Преобразование документов Word в Markdown с помощью Java[Преобразование документов Word в TIFF в Python] (https://blog.aspose.com/ru/words/convert-word-to-tiff-using-python/)
[Преобразовать Word в HTML в Python] (https://blog.aspose.com/ru/words/convert-word-to-html-in-python/)Преобразование Word в HTML с помощью C#Преобразование Word в HTML с помощью Java
[Преобразовать Word в Markdown в Python] (https://blog.aspose.com/ru/words/convert-word-to-markdown-using-python/)