Виконайте OCR за допомогою C#

OCR (оптичне розпізнавання символів) — це добре відома й широко використовувана технологія для розпізнавання та читання тексту із зображень і сканованих документів. Під час операції OCR символи на зображеннях скануються, розпізнаються та перетворюються на цифрову форму. Перетворений текст можна перевірити та зберегти для виконання подальших операцій. У цій статті я покажу вам, як виконати OCR для програмного перетворення зображень на текст за допомогою бібліотеки C# .NET OCR. Решта статті поділено на наступні розділи.

C# OCR Library - Безкоштовне завантаження

Aspose.OCR for .NET — це потужна та високошвидкісна бібліотека оптичного розпізнавання символів для C#, яка дозволяє легко сканувати та перетворювати зображення на текст. Не потрібні довгі коди, щоб запустити та запустити функції OCR у ваших програмах .NET. Нижче наведено методи встановлення бібліотеки C# OCR.

Встановіть бібліотеку C# .NET OCR через NuGet Package Manager

Просто знайдіть Aspose.OCR у диспетчері пакетів NuGet і встановіть його.

C# бібліотека OCR

Встановіть бібліотеку C# OCR за допомогою консолі менеджера пакетів

Нижче наведено команду для встановлення Aspose.OCR через консоль менеджера пакетів.

PM> Install-Package Aspose.OCR

Перетворення зображення на текст за допомогою бібліотеки C# OCR

Давайте подивимося, як виконати OCR на зображенні, яке, можливо, може бути сторінкою відсканованого документа. Нижче наведено кроки для виконання цієї операції.

  • Створіть екземпляр класу AsposeOcr.
  • Викличте метод AsposeOcr.RecognizeImage(string), передавши шлях до зображення, і передайте результат у рядковий об’єкт.

У наступному прикладі коду показано, як перетворити зображення на текст за допомогою C#.

// Щоб отримати повні приклади та файли даних, перейдіть на сторінку https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Шлях до каталогу документів.
string dataDir = RunExamples.GetDataDir_OCR();

// Ініціалізація екземпляра AsposeOcr
AsposeOcr api = new AsposeOcr();

// Розпізнати зображення
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");

// Відображення розпізнаного тексту
Console.WriteLine(result);

C# Виконання OCR на зображенні з одним рядком тексту

У попередньому прикладі ми розпізнали зображення, яке містило кілька рядків тексту. Однак можливо, що зображення містить лише один рядок тексту. У таких випадках ви можете наказати API розпізнавати лише рядок. Нижче наведено кроки для перетворення зображення, що містить однорядковий текст, у C#.

  • Створіть об’єкт класу AsposeOcr.
  • Викличте метод AsposeOcr.RecognizeLine(string) і передайте йому шлях до файлу зображення.
  • Отримати результат у рядковому об’єкті.

У наведеному нижче прикладі коду показано, як виконати OCR і перетворити зображення, що містить один рядок тексту, за допомогою C#.

// Щоб отримати повні приклади та файли даних, перейдіть на сторінку https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Шлях до каталогу документів.
string dataDir = RunExamples.GetDataDir_OCR();

// Ініціалізація екземпляра AsposeOcr
AsposeOcr api = new AsposeOcr();

// Розпізнати зображення
string result = api.RecognizeLine(dataDir + "sample_line.png");

// Відображення розпізнаного тексту
Console.WriteLine(result);

Виконайте OCR для неанглійських символів

Aspose.OCR не обмежує функції OCR для англійської мови, і ви також можете розпізнавати символи інших мов. Процес розпізнавання та код залишаться незмінними незалежно від мови тексту. Нижче наведено набір символів, які може розпізнати бібліотека C# OCR Aspose.

OCR для неанглійських символів

C# OCR Library - Отримайте безкоштовну ліцензію

Ви можете використовувати Aspose.OCR без оціночних обмежень, попросивши [безкоштовну тимчасову ліцензію][7].

Висновок

У цій статті було продемонстровано, як виконати OCR і програмно перетворити зображення на текст у C#. Ви можете розпізнавати символи на зображеннях, які містять один або кілька рядків тексту. Дізнайтеся більше про бібліотеку C# OCR з документації.

Дивись також