Відсканований файл PDF у формат Excel OCR

Відскановані файли PDF містять дані у форматі зображень, і іноді вам може знадобитися інформація з таких документів. У певних ситуаціях відсканований PDF-файл може містити числову інформацію, якою може знадобитися обробка в Excel. Відповідно до цього ви можете виконувати операції OCR і створювати файл Excel. У цій статті розповідається про те, як програмно створити відсканований конвертер PDF у Excel із функцією OCR за допомогою C#.

Створення відсканованого PDF-файлу в конвертер Excel за допомогою OCR – встановлення C# API

Ви можете працювати з функціями оптичного розпізнавання символів, які пропонує Aspose.OCR for .NET API. Ви можете легко створити сканований конвертер PDF у Excel за допомогою OCR, завантаживши файл DLL із розділу Нові випуски або за допомогою команди встановлення NuGet нижче:

PM> Install-Package Aspose.OCR

Програмне перетворення сканованого PDF-файлу в Excel на C#

Ви можете конвертувати сканований PDF-документ у файл Excel за допомогою OCR, виконавши наведені нижче дії.

  1. Створіть об’єкт класу AsposeOcr.
  2. Укажіть об’єкт класу DocumentRecognitionSettings.
  3. Розпізнайте сканований файл PDF за допомогою методу RecognizePdf.
  4. Збережіть вихідний файл Excel за допомогою методу SaveMultipageDocument.

У наведеному нижче прикладі коду пояснюється, як перетворити сканований PDF-файл у Excel за допомогою C#:

// Шлях сканованого файлу PDF
string path = "Scanned.pdf";

// Ініціалізація об’єкта AsposeOcr calss
AsposeOcr api = new AsposeOcr();

// Вкажіть параметри розпізнавання файлу PDF
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;

// Розпізнавати сторінки зі сканованого файлу PDF
List<RecognitionResult> res = api.RecognizePdf(path , settings);

// Збережіть вихідний результат як файл Excel у форматі XLSX
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);

Отримайте безкоштовну оціночну ліцензію

Ви можете оцінити функцію перетворення відсканованого PDF-файлу в Excel у повній мірі, надіславши запит на безкоштовну тимчасову ліцензію.

Висновок

У цій статті ви перевірили, як перетворити відсканований PDF-файл у Excel за допомогою операцій OCR для оптичного розпізнавання тексту. Це може бути корисним у сценаріях, наприклад, коли файл CSV сканується сканером і створюється файл PDF. Ви можете програмно перетворити його на файл Excel за допомогою C#. Крім того, ви можете ознайомитися з іншими функціями, пов’язаними з оптичним розпізнаванням символів, які пропонує API, переглянувши документацію. У разі будь-яких питань, будь ласка, зв’яжіться з нами на форумі.

Дивись також