テキストを認識するDjVuImageC#OCR

DjVu形式は、スキャンしたドキュメントを保存するために使用されます。テキスト、画像、または図面を含めることができるためです。 DjVuは、最小限のスペースを使用してデータを保存できるため、データのアーカイブに使用されます。この記事では、C#でプログラム的にOCR操作を使用してDjVu画像からテキストを認識する方法について説明します。

DjVu画像からのテキスト認識– C#APIのインストール

Aspose.OCR for .NET APIは、JPG、PNG、PDFなどのさまざまなタイプのドキュメントの光学式文字認識をサポートします。同様に、複数ページのDjVu画像ファイルからのテキスト認識もサポートします。 ダウンロードセクションからAPIのJARファイルをダウンロードすることで、APIを簡単に構成できます。同様に、次のNuGetインストールコマンドを実行して、プロジェクトにライブラリをインストールできます。

PM> Install-Package Aspose.OCR

C#でDjVu画像に対してOCRを実行してテキストを認識する

以下の手順に従って、複数ページのDjVu画像に対してOCR操作を実行することにより、テキストを認識できます。

  1. AsposeOCRクラスを使用してAPIインスタンスを初期化します。
  2. DocumentRecognitionSettingsクラスオブジェクトを作成します。
  3. RecognizeDjvuメソッドを使用してテキストを認識します。
  4. 認識されたテキストを印刷します。

次のコードサンプルは、C#でプログラムによってOCRを実行することにより、DjVu画像からテキストを認識する方法を示しています。

// DJVU画像ファイルパスを入力
string imgPath = "sample1.djvu";

// AsposeOcrクラスオブジェクトを初期化します
AsposeOcr api = new AsposeOcr();

// DJVUからの画像を認識する
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
set.PagesNumber = 0;
List<Aspose.OCR.RecognitionResult> result = api.RecognizeDjvu(imgPath, set);

// 結果を印刷する
int pageNumber = 0;
foreach (var page in result)
{
    System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
}

無料のAPIライセンスを取得する

無料一時ライセンスをリクエストして、評価の制限なしにAPIを評価できます。

結論

結論として、複数ページのDjVu画像でOCR操作を使用してテキストを認識する方法を学習しました。テキスト認識プロセスの精度を高めるために、入力画像の自動コントラストおよびスキューオプションを設定できるドキュメント認識設定を指定する機能を使用して、テキストを認識できます。さらに、ドキュメントセクションを参照することで、APIでサポートされている他のさまざまな機能を調べることができます。懸念事項や要件について話し合う必要がある場合は、フォーラムまでお気軽にご連絡ください。

関連項目

C#でOCRを使用して画像をExcelに変換