Отсканированный PDF в Excel OCR

Отсканированные файлы PDF содержат данные в формате изображения, и иногда вам может понадобиться информация из таких документов. В определенных ситуациях отсканированный PDF-файл может содержать числовую информацию, которую необходимо обработать в Excel. В соответствии с этим вы можете выполнять операции OCR и создавать файл Excel. В этой статье рассказывается, как создать конвертер отсканированных PDF-файлов в Excel с функцией OCR программно с помощью C#.

Создание отсканированного конвертера PDF в Excel с OCR — установка C# API

Вы можете работать с функциями OCR, предлагаемыми API Aspose.OCR для .NET. Вы можете легко создать отсканированный конвертер PDF в Excel с OCR, загрузив файл DLL из раздела Новые выпуски или с помощью команды установки NuGet ниже:

PM> Install-Package Aspose.OCR

Программное преобразование отсканированного PDF в Excel на C#

Вы можете преобразовать отсканированный PDF-документ в файл Excel с помощью OCR, выполнив следующие действия:

  1. Создайте экземпляр объекта класса AsposeOcr.
  2. Укажите объект класса DocumentRecognitionSettings.
  3. Распознайте отсканированный файл PDF с помощью метода RecognizePdf.
  4. Сохраните выходной файл Excel, используя метод SaveMultipageDocument.

В следующем примере кода показано, как преобразовать отсканированный файл PDF в Excel с помощью C#:

// Путь к отсканированному файлу PDF
string path = "Scanned.pdf";

// Инициализировать объект класса AsposeOcr
AsposeOcr api = new AsposeOcr();

// Укажите настройки для распознавания файла PDF
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;

// Распознавать страницы из отсканированного файла PDF
List<RecognitionResult> res = api.RecognizePdf(path , settings);

// Сохраните результат вывода в виде файла Excel в формате XLSX.
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);

Получите бесплатную ознакомительную лицензию

Вы можете оценить функцию преобразования отсканированного PDF в Excel в полном объеме, запросив бесплатную временную лицензию.

Вывод

В этой статье вы проверили, как преобразовать отсканированный PDF-файл в Excel, применив операции OCR для оптического распознавания текста. Это может быть полезно в таких сценариях, как когда файл CSV сканируется сканером и создается файл PDF. Вы можете преобразовать его в файл Excel программно с помощью C#. Кроме того, вы можете ознакомиться с другими функциями OCR, предлагаемыми API, изучив документацию. В случае возникновения каких-либо вопросов, пожалуйста, не стесняйтесь обращаться к нам на форум.

Смотрите также