Выполнение оптического распознавания символов с помощью C#

OCR (оптическое распознавание символов) — это хорошо известная и широко используемая технология для распознавания и чтения текста с изображений и отсканированных документов. В операции OCR символы на изображениях сканируются, распознаются и преобразуются в цифровую форму. Преобразованный текст можно проверить и сохранить для выполнения дальнейших операций. В этой статье я покажу вам, как выполнить OCR для преобразования изображений в текст программным путем с помощью C# в ваших приложениях .NET. Остальная часть статьи разделена на следующие разделы.

Библиотека C# OCR — установка

Aspose.OCR для .NET — это мощная библиотека OCR, позволяющая легко сканировать и преобразовывать изображения в текст. Не требуется длинных кодов, чтобы запустить функции OCR в ваших приложениях .NET. Ниже приведены способы установки библиотеки C# OCR.

Установить через диспетчер пакетов NuGet

Просто найдите Aspose.OCR в диспетчере пакетов NuGet и установите его.

Библиотека оптического распознавания символов С#

Установить через консоль диспетчера пакетов

Ниже приведена команда для установки Aspose.OCR через консоль диспетчера пакетов.

PM> Install-Package Aspose.OCR

Преобразование изображения в текст с помощью C# OCR API

Давайте посмотрим, как выполнить распознавание текста на изображении, которое может быть страницей отсканированного документа. Ниже приведены шаги для выполнения этой операции.

  • Создайте экземпляр класса AsposeOcr.
  • Вызовите метод AsposeOcr.RecognizeImage(string), передав путь к изображению и получив результат в виде строкового объекта.

В следующем примере кода показано, как преобразовать изображение в текст с помощью C#.

// Полные примеры и файлы данных см. на странице https://github.com/aspose-ocr/Aspose.OCR-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_OCR();

// Инициализировать экземпляр AsposeOcr
AsposeOcr api = new AsposeOcr();

// Распознать изображение
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");

// Показать распознанный текст
Console.WriteLine(result);

Выполните OCR на изображении с одной строкой текста

В предыдущем примере мы выполнили распознавание текста на изображении, содержащем несколько строк текста. Однако возможно, что изображение содержит только одну строку текста. В таких случаях вы можете указать API распознавать только строку. Ниже приведены шаги для преобразования изображения, содержащего однострочный текст.

  • Создайте объект класса AsposeOcr.
  • Вызовите метод AsposeOcr.RecognizeLine(string) и передайте ему путь к файлу изображения.
  • Получить результат в строковый объект.

В следующем примере кода показано, как выполнить распознавание символов и преобразовать изображение, содержащее одну строку текста, с помощью C#.

// Полные примеры и файлы данных см. на странице https://github.com/aspose-ocr/Aspose.OCR-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_OCR();

// Инициализировать экземпляр AsposeOcr
AsposeOcr api = new AsposeOcr();

// Распознать изображение
string result = api.RecognizeLine(dataDir + "sample_line.png");

// Показать распознанный текст
Console.WriteLine(result);

Выполнение OCR для неанглийских символов

Aspose.OCR не ограничивает функции OCR для английского языка, и вы также можете распознавать символы других языков. Процесс распознавания и код останутся одинаковыми независимо от языка текста. Ниже приведен набор символов, которые могут быть распознаны API OCR Aspose.

OCR для неанглийских символов

Вывод

В этой статье показано, как выполнять распознавание символов и программно преобразовывать изображения в текст с помощью C#. Вы можете распознавать символы на изображениях, содержащих одну или несколько строк текста. Узнайте больше об C# OCR API из документации.

Смотрите также