Java での OCR 画像からテキストへの変換とスペル修正

画像またはスキャンしたドキュメントに対して OCR を実行し、Java を使用してプログラムで画像からテキストを認識および抽出できます。次に、スペル チェッカーを実行して、認識されたテキストのスペル ミスを修正します。この記事では、Java でスペル修正を使用して画像をテキストに変換する方法を学習します。

この記事では、次のトピックについて説明します。

  1. スペル修正付き Java 画像からテキストへのコンバーター
  2. テキストへの OCR 画像とスペルミスの取得
  3. スペル修正で画像をテキストに変換
  4. スペルを修正して画像をテキストに保存
  5. スペル チェック カスタム テキスト

スペル修正機能付き Java 画像からテキストへのコンバーター

画像をスペル修正付きのテキストに変換するには、Aspose.OCR for Java API を使用します。スキャンした画像、スマートフォンの写真、スクリーンショット、画像の一部、スキャンした PDF に対して OCR を実行できます。認識されたテキスト結果を一般的なドキュメント形式で保存できます。この API では、画像をテキストに変換したり、認識されたテキストのスペルミスを自動修正したりすることもできます。

AsposeOCR クラスは、OCR 操作を実行するための主要な API です。このクラスの RecognizePage(String fullPath, RecognitionSettings settings) メソッドは、サポートされている形式 の画像上のテキストを認識します。 API の CorrectSpelling(String text, SpellCheckLanguage language) メソッドは、スペルミスのある単語をテキスト内の正しい単語に置き換えます。 RecognitionResult クラスは、画像認識の結果を表します。このクラスの saveSpellCheckCorrectedText(string, Format, SpellCheckLanguage, string) メソッドは、ドキュメントを プレーン テキストPDF、または Microsoft Word ドキュメント として保存します。スペルチェックでサポートされているすべての言語は、SpellCheckLanguage 列挙で定義されています。

API の JAR をダウンロード するか、Maven ベースの Java アプリケーションに次の pom.xml 構成を追加してください。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>22.6</version>
</dependency>

画像からテキストへの OCR と Java でのスペルミスの取得

以下の手順に従って、画像に対して OCR を実行し、認識されたテキストのスペル ミスのリストを取得できます。

  1. まず、AsposeOCR クラスのインスタンスを作成します。
  2. 次に、RecognitionSettings クラスのオブジェクトを初期化します。
  3. 次に、RecognizePage() メソッドを呼び出して RecognitionResult を取得します。画像パスと RecognitionSettings オブジェクトを引数として取ります。
  4. その後、 getSpellCheckErrorList() メソッドを呼び出して、スペルミスのある単語のリストと候補を取得します。
  5. 最後に、SpellCheckError リストをループして結果を表示します。

次のサンプル コードは、Java で認識されたテキストからスペル ミスのリストを取得する方法を示しています。

// このコード例は、認識されたテキストからスペルミスのリストを取得する方法を示しています
String imagePath = "C:\\Files\\sample.jpg";

// OCR API の作成
AsposeOCR api = new AsposeOCR();

// 認識設定の初期化
RecognitionSettings settings = new RecognitionSettings();

// 画像認識           
RecognitionResult result = api.RecognizePage(imagePath, settings);

// スペルミスのある単語のリストを提案付きで取得する
List<SpellCheckError> errorsList = result.getSpellCheckErrorList(SpellCheckLanguage.Eng);

for (SpellCheckError error : errorsList)
{
    // 単語を表示
    System.out.println("Misspelled Word - " + error.word);
  
    // 候補の単語を表示する
    for(SuggestedWord suggest : error.suggestedWords)
    {
      System.out.println("Suggested word - " + suggest.word);
    }

    System.out.println();
}
画像からテキストへの OCR と Java でのスペルミスの取得

Java のスペルミスのリストを取得する

Java でスペル修正を使用して画像をテキストに変換する

以下の手順に従って、画像をテキストに変換し、スペルミスを自動修正できます。

  1. まず、AsposeOCR クラスのインスタンスを作成します。
  2. 次に、RecognitionSettings クラスのオブジェクトを初期化します。
  3. 次に、RecognizePage() メソッドを呼び出して RecognitionResult を取得します。画像パスと RecognitionSettings オブジェクトを引数として取ります。
  4. その後、 getSpellCheckCorrectedText() メソッドを呼び出して、スペル修正されたテキストを取得します。
  5. 最後に、結果を表示します。

次のサンプル コードは、Java で認識されたテキストからスペル ミスを自動修正する方法を示しています。

// このコード例は、認識されたテキストからスペル ミスを自動修正する方法を示しています。
// 認識する画像へのパス
String imagePath = "C:\\Files\\sample.jpg";

// OCR API の作成
AsposeOCR api = new AsposeOCR();

// 認識設定の初期化
RecognitionSettings settings = new RecognitionSettings();

// 画像からテキストを認識する    
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// 修正結果を得る
String correctedResult = result.getSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// 結果を示す
System.out.println(correctedResult);
Java でスペル修正を使用して画像をテキストに変換する

Java でスペル修正を使用して画像をテキストに変換する

Java でスペルを修正して画像をテキストに保存する

以下の手順に従って、スペル修正後に画像から認識されたテキストを保存できます。

  1. まず、AsposeOCR クラスのインスタンスを作成します。
  2. 次に、RecognitionSettings クラスのオブジェクトを初期化します。
  3. その後、RecognizePage() メソッドを呼び出して RecognitionResult を取得します。画像パスと RecognitionSettings オブジェクトを引数として取ります。
  4. 最後に、saveSpellCheckCorrectedText() メソッドを呼び出してテキストを保存します。

次のサンプル コードは、Java でスペルを修正してテキストを保存する方法を示しています。

// このコード例は、認識されたテキストをスペル修正して保存する方法を示しています。
// 認識する画像へのパス
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";

// OCR API の作成
AsposeOCR api = new AsposeOCR();

// 認識設定の初期化
RecognitionSettings settings = new RecognitionSettings();

// 画像からテキストを認識する 
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// 修正したテキストを保存する
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);

Java でのスペル チェック テキスト

以下の手順に従って、カスタム テキストでスペル チェックを実行することもできます。

  1. まず、AsposeOCR クラスのインスタンスを作成します。
  2. 次に、CorrectSpelling() メソッドを呼び出します。修正するテキストと SpellCheckLanguage を引数として取ります。
  3. 最後に、結果を表示します。

次のサンプル コードは、Java でカスタム テキストをスペル チェックする方法を示しています。

// このコード例は、カスタム テキスト文字列でスペル チェックを実行する方法を示しています。
// スペルチェック用テキスト
String textToCorrect = "This is sample text wth errrors";

// OCR API の作成
AsposeOCR api = new AsposeOCR();

// スペル チェックを実行してエラーを修正する
String correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// 結果を示す
System.out.println(correctedText);
This is sample text with errors

Get a Free Evaluation License

無料の一時ライセンスを取得して、評価制限なしで Aspose.OCR for Java を試すことができます。

Conclusion

この記事では、次の方法を学びました。

  • OCR を実行し、画像上のテキストを認識します。
  • 画像をテキストに変換します。
  • スペルミスのある単語のリストと正しい単語の提案を取得します。
  • スペルミスを自動修正します。
  • Java を使用して修正したテキストを保存します。

スペル修正を使用して画像をテキストに変換する以外に、ドキュメント を使用して Aspose.OCR for Java API について詳しく知ることができます。ご不明な点がございましたら、無料サポート フォーラムまでお気軽にお問い合わせください。

See Also