
Формат DjVu используется для хранения отсканированных документов, поскольку они могут содержать текст, изображения или рисунки. DjVu используется для архивирования данных, потому что он может хранить данные, используя минимальное пространство. В этой статье рассказывается, как программно распознавать текст из изображений DjVu с помощью операций OCR на C#.
- Распознавание текста из изображения DjVu — установка C# API
- Распознайте текст, выполнив OCR на изображении DjVu в C#
Распознавание текста из изображения DjVu — установка C# API
Aspose.OCR для .NET API поддерживает оптическое распознавание символов для различных типов документов, таких как JPG, PNG, PDF и т. д. Кроме того, он также поддерживает распознавание текста из многостраничных файлов изображений DjVu. Вы можете легко настроить API, загрузив JAR-файл API из раздела Загрузки. Аналогичным образом вы можете запустить следующую команду установки NuGet, чтобы установить библиотеку в свой проект:
PM> Install-Package Aspose.OCR
Распознайте текст, выполнив OCR на изображении DjVu в C#
Вы можете распознавать текст, выполняя операции OCR на многостраничных изображениях DjVu, выполнив следующие шаги:
- Инициализируйте экземпляр API с помощью класса AsposeOCR.
- Создайте объект класса DocumentRecognitionSettings.
- Распознавайте текст с помощью метода RecognizeDjvu.
- Распечатайте распознанный текст.
В следующем примере кода показано, как распознавать текст из изображения DjVu путем программного распознавания текста на C#:
// Введите путь к файлу образа DJVU
string imgPath = "sample1.djvu";
// Инициализировать объект класса AsposeOcr
AsposeOcr api = new AsposeOcr();
// Распознавать изображения из DJVU
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
set.PagesNumber = 0;
List<Aspose.OCR.RecognitionResult> result = api.RecognizeDjvu(imgPath, set);
// Распечатать результат
int pageNumber = 0;
foreach (var page in result)
{
System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
}
Получите бесплатную лицензию API
Вы можете запросить Бесплатную временную лицензию для ознакомления с API без каких-либо ограничений.
Вывод
В заключение вы узнали, как распознавать текст с помощью операций OCR на многостраничном изображении DjVu. Вы можете распознавать текст с возможностью указать параметры распознавания документа, где вы можете установить параметры автоконтрастности и перекоса для входного изображения, чтобы повысить точность процесса распознавания текста. Кроме того, вы можете ознакомиться с другими функциями, поддерживаемыми API, в разделе документация. Если вам необходимо обсудить какие-либо вопросы или требования, пожалуйста, напишите нам на форум.
Смотрите также
[Преобразование изображения в Excel с помощью OCR в C#] (https://blog.aspose.com/ru/2022/01/26/image-to-excel-ocr-csharp/)