Преобразование изображения в текст с помощью библиотеки C# OCR

Выполнение оптического распознавания символов с помощью C#

OCR (оптическое распознавание символов) — это хорошо известная и широко используемая технология для распознавания и чтения текста с изображений и отсканированных документов. В операции OCR символы на изображениях сканируются, распознаются и преобразуются в цифровую форму. Преобразованный текст можно проверить и сохранить для выполнения дальнейших операций. В этой статье я покажу вам, как выполнить OCR для преобразования изображений в текст программным путем с помощью C# в ваших приложениях .NET. Остальная часть статьи разделена на следующие разделы.

Библиотека C# OCR — установка
Преобразование изображения в текст с помощью C# OCR API
Выполнение оптического распознавания символов на изображениях с одной строкой текста

Библиотека C# OCR — установка

Aspose.OCR для .NET — это мощная библиотека OCR, позволяющая легко сканировать и преобразовывать изображения в текст. Не требуется длинных кодов, чтобы запустить функции OCR в ваших приложениях .NET. Ниже приведены способы установки библиотеки C# OCR.

Установить через диспетчер пакетов NuGet

Просто найдите Aspose.OCR в диспетчере пакетов NuGet и установите его.

Библиотека оптического распознавания символов С#

Установить через консоль диспетчера пакетов

Ниже приведена команда для установки Aspose.OCR через консоль диспетчера пакетов.

PM> Install-Package Aspose.OCR

Преобразование изображения в текст с помощью C# OCR API

Давайте посмотрим, как выполнить распознавание текста на изображении, которое может быть страницей отсканированного документа. Ниже приведены шаги для выполнения этой операции.

Создайте экземпляр класса AsposeOcr.
Вызовите метод AsposeOcr.RecognizeImage(string), передав путь к изображению и получив результат в виде строкового объекта.

В следующем примере кода показано, как преобразовать изображение в текст с помощью C#.

// Полные примеры и файлы данных см. на странице https://github.com/aspose-ocr/Aspose.OCR-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_OCR();

// Инициализировать экземпляр AsposeOcr
AsposeOcr api = new AsposeOcr();

// Распознать изображение
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");

// Показать распознанный текст
Console.WriteLine(result);

Выполните OCR на изображении с одной строкой текста

В предыдущем примере мы выполнили распознавание текста на изображении, содержащем несколько строк текста. Однако возможно, что изображение содержит только одну строку текста. В таких случаях вы можете указать API распознавать только строку. Ниже приведены шаги для преобразования изображения, содержащего однострочный текст.

Создайте объект класса AsposeOcr.
Вызовите метод AsposeOcr.RecognizeLine(string) и передайте ему путь к файлу изображения.
Получить результат в строковый объект.

В следующем примере кода показано, как выполнить распознавание символов и преобразовать изображение, содержащее одну строку текста, с помощью C#.

// Полные примеры и файлы данных см. на странице https://github.com/aspose-ocr/Aspose.OCR-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_OCR();

// Инициализировать экземпляр AsposeOcr
AsposeOcr api = new AsposeOcr();

// Распознать изображение
string result = api.RecognizeLine(dataDir + "sample_line.png");

// Показать распознанный текст
Console.WriteLine(result);

Выполнение OCR для неанглийских символов

Aspose.OCR не ограничивает функции OCR для английского языка, и вы также можете распознавать символы других языков. Процесс распознавания и код останутся одинаковыми независимо от языка текста. Ниже приведен набор символов, которые могут быть распознаны API OCR Aspose.

Вывод

В этой статье показано, как выполнять распознавание символов и программно преобразовывать изображения в текст с помощью C#. Вы можете распознавать символы на изображениях, содержащих одну или несколько строк текста. Узнайте больше об C# OCR API из документации.

Смотрите также

Выполнение оптического распознавания символов на изображениях с помощью C++

Библиотека C# OCR — установка#

Установить через диспетчер пакетов NuGet#

Установить через консоль диспетчера пакетов#

Преобразование изображения в текст с помощью C# OCR API#

Выполните OCR на изображении с одной строкой текста#

Выполнение OCR для неанглийских символов#

Вывод#

Смотрите также#