Отсканированные файлы PDF содержат данные в формате изображения, и иногда вам может понадобиться информация из таких документов. В определенных ситуациях отсканированный PDF-файл может содержать числовую информацию, которую необходимо обработать в Excel. В соответствии с этим вы можете выполнять операции OCR и создавать файл Excel. В этой статье рассказывается, как создать конвертер отсканированных PDF-файлов в Excel с функцией OCR программно с помощью C#.
- Создание отсканированного конвертера PDF в Excel с OCR — установка C# API
- Программное преобразование отсканированного PDF в Excel на C#
Создание отсканированного конвертера PDF в Excel с OCR — установка C# API
Вы можете работать с функциями OCR, предлагаемыми API Aspose.OCR для .NET. Вы можете легко создать отсканированный конвертер PDF в Excel с OCR, загрузив файл DLL из раздела Новые выпуски или с помощью команды установки NuGet ниже:
PM> Install-Package Aspose.OCR
Программное преобразование отсканированного PDF в Excel на C#
Вы можете преобразовать отсканированный PDF-документ в файл Excel с помощью OCR, выполнив следующие действия:
- Создайте экземпляр объекта класса AsposeOcr.
- Укажите объект класса DocumentRecognitionSettings.
- Распознайте отсканированный файл PDF с помощью метода RecognizePdf.
- Сохраните выходной файл Excel, используя метод SaveMultipageDocument.
В следующем примере кода показано, как преобразовать отсканированный файл PDF в Excel с помощью C#:
// Путь к отсканированному файлу PDF
string path = "Scanned.pdf";
// Инициализировать объект класса AsposeOcr
AsposeOcr api = new AsposeOcr();
// Укажите настройки для распознавания файла PDF
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;
// Распознавать страницы из отсканированного файла PDF
List<RecognitionResult> res = api.RecognizePdf(path , settings);
// Сохраните результат вывода в виде файла Excel в формате XLSX.
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);
Получите бесплатную ознакомительную лицензию
Вы можете оценить функцию преобразования отсканированного PDF в Excel в полном объеме, запросив бесплатную временную лицензию.
Вывод
В этой статье вы проверили, как преобразовать отсканированный PDF-файл в Excel, применив операции OCR для оптического распознавания текста. Это может быть полезно в таких сценариях, как когда файл CSV сканируется сканером и создается файл PDF. Вы можете преобразовать его в файл Excel программно с помощью C#. Кроме того, вы можете ознакомиться с другими функциями OCR, предлагаемыми API, изучив документацию. В случае возникновения каких-либо вопросов, пожалуйста, не стесняйтесь обращаться к нам на форум.