OCR зображення в текст і виправлення орфографії в Java

Ми можемо виконувати розпізнавання зображень або сканованих документів, щоб програмно розпізнавати та вилучати текст із зображень за допомогою Java. Потім ми можемо запустити перевірку орфографії, щоб виправити орфографічні помилки в розпізнаному тексті. У цій статті ми дізнаємося, як перетворити зображення в текст з корекцією орфографії в Java.

У цій статті будуть розглянуті такі теми:

  1. Конвертер зображень Java у текст із корекцією орфографії
  2. OCR зображення в текст і пошук орфографічних помилок
  3. Перетворення зображення на текст із виправленням орфографії
  4. Зберегти зображення в тексті з виправленими орфографічними помилками
  5. Користувацький текст перевірки правопису

Перетворювач зображень Java у текст із корекцією орфографії

Щоб перетворити зображення на текст із виправленням орфографії, ми будемо використовувати Aspose.OCR for Java API. Він дозволяє виконувати OCR сканованих зображень, фотографій зі смартфона, скріншотів, ділянок зображення та сканованих PDF-файлів. Це дозволяє нам зберігати результати розпізнаного тексту в популярних форматах документів. API також дозволяє перетворювати зображення на текст і автоматично виправляти орфографічні помилки в розпізнаному тексті.

Клас AsposeOCR є основним API для виконання операцій OCR. Метод RecognizePage(String fullPath, RecognitionSettings settings) цього класу розпізнає текст на зображеннях підтримуваних форматів. Метод CorrectSpelling(String text, SpellCheckLanguage language) API замінює слова з орфографічними помилками правильними словами в тексті. Клас RecognitionResult представляє результати розпізнавання зображень. Метод saveSpellCheckCorrectedText(string, Format, SpellCheckLanguage, string) цього класу зберігає документ як звичайний текст, PDF або Документ Microsoft Word. Усі підтримувані мови для перевірки правопису визначено в переліку SpellCheckLanguage.

Будь ласка, завантажте JAR API або додайте наступну конфігурацію pom.xml у програму Java на основі Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>22.6</version>
</dependency>

OCR зображення в текст і пошук орфографічних помилок у Java

Ми можемо розпізнати зображення та отримати список орфографічних помилок у розпізнаному тексті, виконавши наведені нижче дії.

  1. По-перше, створіть екземпляр класу AsposeOCR.
  2. Далі ініціалізуйте об’єкт класу RecognitionSettings.
  3. Потім отримайте RecognitionResult, викликавши метод RecognizePage(). Він приймає шлях зображення та об’єкт RecognitionSettings як аргументи.
  4. Після цього викличте метод getSpellCheckErrorList(), щоб отримати список слів із помилками та пропозиціями.
  5. Нарешті, прокрутіть список SpellCheckError і покажіть результати.

У наступному прикладі коду показано, як отримати список орфографічних помилок із розпізнаного тексту в Java.

// Цей приклад коду демонструє, як отримати список орфографічних помилок із розпізнаного тексту
String imagePath = "C:\\Files\\sample.jpg";

// Створення OCR API
AsposeOCR api = new AsposeOCR();

// Ініціалізація налаштувань розпізнавання
RecognitionSettings settings = new RecognitionSettings();

// Розпізнати зображення           
RecognitionResult result = api.RecognizePage(imagePath, settings);

// Отримайте список слів з орфографічними помилками з пропозиціями
List<SpellCheckError> errorsList = result.getSpellCheckErrorList(SpellCheckLanguage.Eng);

for (SpellCheckError error : errorsList)
{
    // Показати слово
    System.out.println("Misspelled Word - " + error.word);
  
    // Показати запропоновані слова
    for(SuggestedWord suggest : error.suggestedWords)
    {
      System.out.println("Suggested word - " + suggest.word);
    }

    System.out.println();
}
OCR зображення в текст і пошук орфографічних помилок у Java

Отримайте список орфографічних помилок у Java

Перетворення зображення на текст із корекцією орфографії в Java

Ми можемо перетворити зображення на текст і автоматично виправити орфографічні помилки, виконавши наведені нижче дії.

  1. По-перше, створіть екземпляр класу AsposeOCR.
  2. Далі ініціалізуйте об’єкт класу RecognitionSettings.
  3. Потім отримайте RecognitionResult, викликавши метод RecognizePage(). Він приймає шлях зображення та об’єкт RecognitionSettings як аргументи.
  4. Після цього викличте метод getSpellCheckCorrectedText(), щоб отримати текст із виправленням орфографії.
  5. Нарешті, покажіть результати.

Наведений нижче приклад коду показує, як автоматично виправляти орфографічні помилки з розпізнаного тексту в Java.

// Цей приклад коду демонструє, як автоматично виправляти орфографічні помилки в розпізнаному тексті.
// Шлях до зображення для розпізнавання
String imagePath = "C:\\Files\\sample.jpg";

// Створення OCR API
AsposeOCR api = new AsposeOCR();

// Ініціалізація налаштувань розпізнавання
RecognitionSettings settings = new RecognitionSettings();

// Розпізнавати текст із зображення    
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Отримати виправлений результат
String correctedResult = result.getSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Показати результати
System.out.println(correctedResult);
Перетворення зображення на текст із корекцією орфографії в Java

Перетворення зображення на текст із корекцією орфографії в Java

Збережіть зображення в тексті з виправленими орфографічними написами в Java

Ми можемо зберегти розпізнаний текст із зображення після виправлення орфографії, виконавши наведені нижче дії.

  1. По-перше, створіть екземпляр класу AsposeOCR.
  2. Далі ініціалізуйте об’єкт класу RecognitionSettings.
  3. Після цього отримайте RecognitionResult, викликавши метод RecognizePage(). Він приймає шлях зображення та об’єкт RecognitionSettings як аргументи.
  4. Нарешті, викличте метод saveSpellCheckCorrectedText(), щоб зберегти текст.

У наступному прикладі коду показано, як зберегти текст із виправленням орфографії в Java.

// Цей приклад коду демонструє, як зберегти розпізнаний текст із виправленням орфографії.
// Шлях до зображення для розпізнавання
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";

// Створення OCR API
AsposeOCR api = new AsposeOCR();

// Ініціалізація налаштувань розпізнавання
RecognitionSettings settings = new RecognitionSettings();

// Розпізнавати текст із зображення 
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Збережіть виправлений текст
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);

Перевірка орфографії тексту в Java

Ми також можемо запустити перевірку орфографії для спеціального тексту, виконавши наведені нижче дії.

  1. По-перше, створіть екземпляр класу AsposeOCR.
  2. Далі викличте метод CorrectSpelling(). Він приймає текст для виправлення та SpellCheckLanguage як аргументи.
  3. Нарешті, покажіть результати.

У наведеному нижче прикладі коду показано, як перевірити орфографію спеціального тексту в Java.

// Цей приклад коду демонструє, як запустити перевірку орфографії для власного текстового рядка.
// Текст для перевірки орфографії
String textToCorrect = "This is sample text wth errrors";

// Створення OCR API
AsposeOCR api = new AsposeOCR();

// Запустіть перевірку правопису, щоб виправити помилки
String correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Показати результати
System.out.println(correctedText);
This is sample text with errors

Отримайте безкоштовну оціночну ліцензію

Ви можете отримати безкоштовну тимчасову ліцензію, щоб спробувати Aspose.OCR for Java без оціночних обмежень.

Висновок

У цій статті ми дізналися, як:

  • виконувати OCR і розпізнавати текст на зображеннях;
  • перетворювати зображення в текст;
  • отримати список слів з орфографічними помилками разом із пропозиціями правильних слів;
  • автовиправлення орфографічних помилок;
  • зберегти виправлений текст за допомогою Java.

Окрім перетворення зображення на текст із виправленням орфографії, ви можете дізнатися більше про Aspose.OCR for Java API за допомогою документації. У разі будь-яких неясностей зв’яжіться з нами на нашому безкоштовному форумі підтримки.

Дивись також