Відскановані файли PDF містять дані у форматі зображень, і іноді вам може знадобитися інформація з таких документів. У певних ситуаціях відсканований PDF-файл може містити числову інформацію, якою може знадобитися обробка в Excel. Відповідно до цього ви можете виконувати операції OCR і створювати файл Excel. У цій статті розповідається про те, як програмно створити відсканований конвертер PDF у Excel із функцією OCR за допомогою C#.
- Створення відсканованого PDF-файлу в конвертер Excel за допомогою OCR – встановлення C# API
- Програмне перетворення сканованого PDF-файлу в Excel на C#
Створення відсканованого PDF-файлу в конвертер Excel за допомогою OCR – встановлення C# API
Ви можете працювати з функціями оптичного розпізнавання символів, які пропонує Aspose.OCR for .NET API. Ви можете легко створити сканований конвертер PDF у Excel за допомогою OCR, завантаживши файл DLL із розділу Нові випуски або за допомогою команди встановлення NuGet нижче:
PM> Install-Package Aspose.OCR
Програмне перетворення сканованого PDF-файлу в Excel на C#
Ви можете конвертувати сканований PDF-документ у файл Excel за допомогою OCR, виконавши наведені нижче дії.
- Створіть об’єкт класу AsposeOcr.
- Укажіть об’єкт класу DocumentRecognitionSettings.
- Розпізнайте сканований файл PDF за допомогою методу RecognizePdf.
- Збережіть вихідний файл Excel за допомогою методу SaveMultipageDocument.
У наведеному нижче прикладі коду пояснюється, як перетворити сканований PDF-файл у Excel за допомогою C#:
// Шлях сканованого файлу PDF
string path = "Scanned.pdf";
// Ініціалізація об’єкта AsposeOcr calss
AsposeOcr api = new AsposeOcr();
// Вкажіть параметри розпізнавання файлу PDF
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;
// Розпізнавати сторінки зі сканованого файлу PDF
List<RecognitionResult> res = api.RecognizePdf(path , settings);
// Збережіть вихідний результат як файл Excel у форматі XLSX
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);
Отримайте безкоштовну оціночну ліцензію
Ви можете оцінити функцію перетворення відсканованого PDF-файлу в Excel у повній мірі, надіславши запит на безкоштовну тимчасову ліцензію.
Висновок
У цій статті ви перевірили, як перетворити відсканований PDF-файл у Excel за допомогою операцій OCR для оптичного розпізнавання тексту. Це може бути корисним у сценаріях, наприклад, коли файл CSV сканується сканером і створюється файл PDF. Ви можете програмно перетворити його на файл Excel за допомогою C#. Крім того, ви можете ознайомитися з іншими функціями, пов’язаними з оптичним розпізнаванням символів, які пропонує API, переглянувши документацію. У разі будь-яких питань, будь ласка, зв’яжіться з нами на форумі.