OCR зображення в текст і виправлення орфографії в C#

Ми можемо виконувати розпізнавання зображень або сканованих документів і програмно видобувати текстові дані за допомогою C#. Потім ми можемо запустити перевірку орфографії, щоб виправити орфографічні помилки в розпізнаному тексті. У цій статті ми навчимося виконувати оптичне розпізнавання зображення в тексті та виправлення орфографії в C#.

У цій статті будуть розглянуті такі теми:

  1. OCR Image to Text і C# Spell Check API
  2. OCR зображення в текст і пошук орфографічних помилок
  3. Перетворення зображення на текст із виправленням орфографії
  4. Зберегти розпізнаний текст із виправленою орфографією
  5. Спеціальний текст перевірки правопису

OCR Image to Text і C# Spell Check API

Ми будемо використовувати API Aspose.OCR for .NET для OCR зображень, вилучення тексту та виправлення орфографії. Він може розпізнавати відскановані зображення, фотографії зі смартфона, скріншоти, області зображень і відскановані PDF-файли. Він повертає розпізнані текстові результати в найпопулярніших форматах документів і обміну даними. API також дозволяє перетворювати зображення на текст і створювати PDF-файли з можливістю пошуку зі сканованих файлів. Крім того, він дозволяє автоматично виправляти орфографічні помилки в розпізнаному тексті.

Клас AsposeOcr є основним API для бібліотеки Aspose OCR. Він надає різні методи для виконання операцій OCR. Метод RecognizeImage() цього класу розпізнає текст на зображеннях підтримуваних форматів. Метод CorrectSpelling() API замінює в тексті слова з орфографічними помилками правильними словами. Клас RecognitionResult представляє результати розпізнавання зображення. Метод Save(string, SaveFormat, bool, SpellCheckLanguage, string) цього класу зберігає документ як звичайний текст, PDF або Microsoft Word Document. Усі підтримувані мови для перевірки орфографії визначено в переліку SpellCheckLanguage.

Завантажте DLL API або встановіть його за допомогою NuGet.

PM> Install-Package Aspose.OCR

Розпізнавання зображення в текст і пошук орфографічних помилок у C#

Ми можемо розпізнати зображення та отримати список орфографічних помилок у розпізнаному тексті, виконавши наведені нижче дії.

  1. По-перше, створіть екземпляр класу AsposeOcr.
  2. Далі ініціалізуйте об’єкт класу RecognitionSettings.
  3. Потім отримайте RecognitionResult, викликавши метод RecognizeImage(). Він приймає шлях зображення та об’єкт RecognitionSettings як аргументи.
  4. Після цього викличте метод GetSpellCheckErrorList(), щоб отримати список слів із помилками та пропозиціями.
  5. Нарешті, прокрутіть список SpellCheckError і покажіть результати.

У наступному прикладі коду показано, як отримати список орфографічних помилок із розпізнаного тексту в C#.

// Цей приклад коду демонструє, як отримати список слів з орфографічними помилками з розпізнаного тексту.
// Шлях до зображення для розпізнавання
string imagePath = @"C:\Files\OCR\sample.png";

// Створення OCR API
AsposeOcr api = new AsposeOcr();

// Ініціалізація налаштувань розпізнавання
RecognitionSettings settings = new RecognitionSettings();

// Розпізнати зображення           
RecognitionResult result = api.RecognizeImage(imagePath, settings);

// Отримайте список слів з орфографічними помилками з пропозиціями
List<SpellCheckError> errorsList = result.GetSpellCheckErrorList(SpellCheckLanguage.Eng);

foreach (var word in errorsList)
{
    Console.WriteLine($"Misspelled Word - {word.Word}");
    foreach (var suggest in word.SuggestedWords)
    {
        Console.WriteLine($"Suggested word - {suggest.Word}");
    }

    Console.WriteLine();
}
Розпізнавання зображення в текст і пошук орфографічних помилок у C#

Отримати список орфографічних помилок у C#

Перетворення зображення на текст із корекцією орфографії в C#

Ми можемо перетворити зображення на текст і автоматично виправити орфографічні помилки, виконавши наведені нижче дії.

  1. По-перше, створіть екземпляр класу AsposeOcr.
  2. Далі ініціалізуйте об’єкт класу RecognitionSettings.
  3. Потім отримайте RecognitionResult, викликавши метод RecognizeImage(). Він приймає шлях зображення та об’єкт RecognitionSettings як аргументи.
  4. Після цього викличте метод GetSpellCheckCorrectedText(), щоб отримати текст із виправленням орфографії.
  5. Нарешті, покажіть результати.

Наведений нижче приклад коду показує, як автоматично виправляти орфографічні помилки з розпізнаного тексту в C#.

// Цей приклад коду демонструє, як автоматично виправляти орфографічні помилки в розпізнаному тексті.
// Шлях до зображення для розпізнавання
string imagePath = @"C:\Files\OCR\sample.png";

// Створення OCR API
AsposeOcr api = new AsposeOcr();

// Ініціалізація налаштувань розпізнавання
RecognitionSettings settings = new RecognitionSettings();

// Розпізнавати текст із зображення    
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Отримати виправлений результат
string correctedResult = result.GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Показати результати
Console.WriteLine(correctedResult);
Перетворення зображення на текст із корекцією орфографії в C#

Перетворення зображення на текст із корекцією орфографії в C#

Збереження розпізнаного тексту з виправленим правописом у C#

Ми можемо зберегти розпізнаний текст із зображення після виправлення орфографії, виконавши наведені нижче дії.

  1. По-перше, створіть екземпляр класу AsposeOcr.
  2. Далі ініціалізуйте об’єкт класу RecognitionSettings.
  3. Після цього отримайте RecognitionResult, викликавши метод RecognizeImage(). Він приймає шлях зображення та об’єкт RecognitionSettings як аргументи.
  4. Нарешті, викличте метод Save(string, SaveFormat, bool, SpellCheckLanguage), щоб зберегти текст. Він приймає логічне значення applySpellingCorrection як true.

У наведеному нижче прикладі коду показано, як зберегти текст із виправленням орфографії в C#.

// Цей приклад коду демонструє, як зберегти розпізнаний текст із виправленням орфографії.
// Шлях до зображення для розпізнавання
string imagePath = @"C:\Files\OCR\sample.png";
string resultPath = @"C:\Files\OCR\MyResult.txt";

// Створення OCR API
AsposeOcr api = new AsposeOcr();

// Ініціалізація налаштувань розпізнавання
RecognitionSettings settings = new RecognitionSettings();
         
// Розпізнавати текст із зображення 
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Збережіть виправлений текст
result.Save(resultPath, SaveFormat.Text, true, SpellCheckLanguage.Eng);

Текст перевірки правопису в C#

Ми також можемо запустити перевірку орфографії для спеціального тексту, виконавши наведені нижче дії.

  1. По-перше, створіть екземпляр класу AsposeOcr.
  2. Далі викличте метод CorrectSpelling(). Він приймає текст для виправлення та SpellCheckLanguage як аргументи.
  3. Нарешті, покажіть результати.

У наведеному нижче прикладі коду показано, як перевірити орфографію спеціального тексту в C#.

// Цей приклад коду демонструє, як запустити перевірку орфографії для власного текстового рядка.
// Текст для перевірки орфографії
string textToCorrect = "This is sample text wth errrors";

// Створення OCR API
AsposeOcr api = new AsposeOcr();

// Запустіть перевірку правопису, щоб виправити помилки
string correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Показати результати
Console.WriteLine(correctedText);
This is sample text with errors

Отримайте безкоштовну оціночну ліцензію

Ви можете отримати безкоштовну тимчасову ліцензію, щоб спробувати Aspose.OCR for .NET без оціночних обмежень.

Висновок

У цій статті ми дізналися, як:

  • виконувати OCR і розпізнавати текст на зображенні в C#;
  • отримати список слів з орфографічними помилками разом із пропозиціями правильних слів;
  • автовиправлення орфографічних помилок;
  • програмно зберегти виправлений текст.

Окрім оптичного розпізнавання зображення в текст і перевірки орфографії в C#, ви можете дізнатися більше про Aspose.OCR for .NET API за допомогою документації. У разі будь-яких неясностей зв’яжіться з нами на нашому безкоштовному форумі підтримки.

Дивись також