Распознать текст DjVu Image C# OCR

Формат DjVu используется для хранения отсканированных документов, поскольку они могут содержать текст, изображения или рисунки. DjVu используется для архивирования данных, потому что он может хранить данные, используя минимальное пространство. В этой статье рассказывается, как программно распознавать текст из изображений DjVu с помощью операций OCR на C#.

Распознавание текста из изображения DjVu — установка C# API

Aspose.OCR для .NET API поддерживает оптическое распознавание символов для различных типов документов, таких как JPG, PNG, PDF и т. д. Кроме того, он также поддерживает распознавание текста из многостраничных файлов изображений DjVu. Вы можете легко настроить API, загрузив JAR-файл API из раздела Загрузки. Аналогичным образом вы можете запустить следующую команду установки NuGet, чтобы установить библиотеку в свой проект:

PM> Install-Package Aspose.OCR

Распознайте текст, выполнив OCR на изображении DjVu в C#

Вы можете распознавать текст, выполняя операции OCR на многостраничных изображениях DjVu, выполнив следующие шаги:

  1. Инициализируйте экземпляр API с помощью класса AsposeOCR.
  2. Создайте объект класса DocumentRecognitionSettings.
  3. Распознавайте текст с помощью метода RecognizeDjvu.
  4. Распечатайте распознанный текст.

В следующем примере кода показано, как распознавать текст из изображения DjVu путем программного распознавания текста на C#:

// Введите путь к файлу образа DJVU
string imgPath = "sample1.djvu";

// Инициализировать объект класса AsposeOcr
AsposeOcr api = new AsposeOcr();

// Распознавать изображения из DJVU
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
set.PagesNumber = 0;
List<Aspose.OCR.RecognitionResult> result = api.RecognizeDjvu(imgPath, set);

// Распечатать результат
int pageNumber = 0;
foreach (var page in result)
{
    System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
}

Получите бесплатную лицензию API

Вы можете запросить Бесплатную временную лицензию для ознакомления с API без каких-либо ограничений.

Вывод

В заключение вы узнали, как распознавать текст с помощью операций OCR на многостраничном изображении DjVu. Вы можете распознавать текст с возможностью указать параметры распознавания документа, где вы можете установить параметры автоконтрастности и перекоса для входного изображения, чтобы повысить точность процесса распознавания текста. Кроме того, вы можете ознакомиться с другими функциями, поддерживаемыми API, в разделе документация. Если вам необходимо обсудить какие-либо вопросы или требования, пожалуйста, напишите нам на форум.

Смотрите также

[Преобразование изображения в Excel с помощью OCR в C#] (https://blog.aspose.com/ru/2022/01/26/image-to-excel-ocr-csharp/)