
OCR (оптическое распознавание символов) — это хорошо известная и широко используемая технология для распознавания и чтения текста с изображений и отсканированных документов. В операции OCR символы на изображениях сканируются, распознаются и преобразуются в цифровую форму. Преобразованный текст можно проверить и сохранить для выполнения дальнейших операций. В этой статье я покажу вам, как выполнить OCR для преобразования изображений в текст программным путем с помощью C# в ваших приложениях .NET. Остальная часть статьи разделена на следующие разделы.
- Библиотека C# OCR — установка
- Преобразование изображения в текст с помощью C# OCR API
- Выполнение оптического распознавания символов на изображениях с одной строкой текста
Библиотека C# OCR — установка
Aspose.OCR для .NET — это мощная библиотека OCR, позволяющая легко сканировать и преобразовывать изображения в текст. Не требуется длинных кодов, чтобы запустить функции OCR в ваших приложениях .NET. Ниже приведены способы установки библиотеки C# OCR.
Установить через диспетчер пакетов NuGet
Просто найдите Aspose.OCR в диспетчере пакетов NuGet и установите его.

Установить через консоль диспетчера пакетов
Ниже приведена команда для установки Aspose.OCR через консоль диспетчера пакетов.
PM> Install-Package Aspose.OCR
Преобразование изображения в текст с помощью C# OCR API
Давайте посмотрим, как выполнить распознавание текста на изображении, которое может быть страницей отсканированного документа. Ниже приведены шаги для выполнения этой операции.
- Создайте экземпляр класса AsposeOcr.
- Вызовите метод AsposeOcr.RecognizeImage(string), передав путь к изображению и получив результат в виде строкового объекта.
В следующем примере кода показано, как преобразовать изображение в текст с помощью C#.
// Полные примеры и файлы данных см. на странице https://github.com/aspose-ocr/Aspose.OCR-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_OCR();
// Инициализировать экземпляр AsposeOcr
AsposeOcr api = new AsposeOcr();
// Распознать изображение
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");
// Показать распознанный текст
Console.WriteLine(result);
Выполните OCR на изображении с одной строкой текста
В предыдущем примере мы выполнили распознавание текста на изображении, содержащем несколько строк текста. Однако возможно, что изображение содержит только одну строку текста. В таких случаях вы можете указать API распознавать только строку. Ниже приведены шаги для преобразования изображения, содержащего однострочный текст.
- Создайте объект класса AsposeOcr.
- Вызовите метод AsposeOcr.RecognizeLine(string) и передайте ему путь к файлу изображения.
- Получить результат в строковый объект.
В следующем примере кода показано, как выполнить распознавание символов и преобразовать изображение, содержащее одну строку текста, с помощью C#.
// Полные примеры и файлы данных см. на странице https://github.com/aspose-ocr/Aspose.OCR-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_OCR();
// Инициализировать экземпляр AsposeOcr
AsposeOcr api = new AsposeOcr();
// Распознать изображение
string result = api.RecognizeLine(dataDir + "sample_line.png");
// Показать распознанный текст
Console.WriteLine(result);
Выполнение OCR для неанглийских символов
Aspose.OCR не ограничивает функции OCR для английского языка, и вы также можете распознавать символы других языков. Процесс распознавания и код останутся одинаковыми независимо от языка текста. Ниже приведен набор символов, которые могут быть распознаны API OCR Aspose.

Вывод
В этой статье показано, как выполнять распознавание символов и программно преобразовывать изображения в текст с помощью C#. Вы можете распознавать символы на изображениях, содержащих одну или несколько строк текста. Узнайте больше об C# OCR API из документации.