Python での OCR パスポート |パスポートを読む |パスポートOCR API

光学文字認識 (OCR) テクノロジーを使用すると、ユーザーは画像や文書からテキストを抽出でき、パスポートの読み取りなどのタスクに強力なツールになります。パスポートに対して OCR を実行すると、パスポートから情報を読み取って抽出するプロセスを効率化できます。このブログ投稿では、Python でパスポートを OCR し、パスポートのテキストを読み取る方法を学びます。

この記事では次のトピックについて説明します。

  1. Python によるパスポート OCR API
  2. Python での OCR パスポート
  3. パスポートのテキストを抽出して保存
  4. 無料の Python OCR リソース

Python のパスポート OCR API

Aspose.OCR for Python を使用してパスポート画像に OCR を実行し、画像からパスポートのテキストを読み取ります。 Aspose.OCR for Python は、Python アプリケーションに OCR 機能を追加できる強力な光学式文字認識 (OCR) API です。簡単に言うと、画像、PDF、その他のファイルからテキストを抽出するのに役立ちます。

パッケージをダウンロードするか、コンソールで次の pip コマンドを使用して PyPI から API をインストールしてください。

pip install aspose-ocr-python-net

OCR パスポート - Python でパスポートのテキストを読み取る

以下の手順に従って、パスポート画像に対して OCR を実行し、認識されたテキストを読み取ることができます。

  1. AsposeOcr クラスのインスタンスを作成します。
  2. PreprocessingFilter クラス オブジェクトを使用してフィルターを追加します。
  3. OcrInput クラスのインスタンスを作成します。
  4. add() メソッドを使用してパスポート画像を追加します。
  5. PassportRecognitionSettings クラスのオブジェクトを初期化します。
  6. その後、recognizepassport() メソッドを使用して認識プロセスを実行します。
  7. 最後に、特定されたテキストを表示します。

次のサンプル コードは、Python でパスポートを OCR し、パスポートのテキストを読み取る方法を示しています。

import aspose.ocr as ocr

# OCRエンジニアを初期化する
api = ocr.AsposeOcr()

# フィルターを追加する
filters = ocr.models.preprocessingfilters.PreprocessingFilter()

# 画像コレクションを初期化し、そこに画像を入れます
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")

# 認識オプションを変更する
settings = ocr.PassportRecognitionSettings()

# 実行認識
res = api.recognize_passport(passport, settings)

# 印刷結果
for result in res:
    print(result.recognition_text)

Python でパスポートのテキストを抽出して保存する

前述の手順に従って、パスポートで OCR を実行し、認識されたテキストを保存できます。ただし、savemultipagedocument() メソッドを使用して結果を保存する必要があるだけです。出力ファイルのパス、出力ファイル形式、認識結果オブジェクトを引数として受け取ります。

次のサンプル コードは、パスポートを OCR し、認識されたテキストを Python で保存する方法を示しています。

import aspose.ocr as ocr

# OCRエンジニアを初期化する
api = ocr.AsposeOcr()

# フィルターを追加する
filters = ocr.models.preprocessingfilters.PreprocessingFilter()

# 画像コレクションを初期化し、そこに画像を入れます
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")

# 認識オプションを変更する
settings = ocr.PassportRecognitionSettings()

# 実行認識
res = api.recognize_passport(passport, settings)

# print("# 修正したテキストを保存")
api.save_multipage_document("sample_out.txt", ocr.SaveFormat.TEXT, res)

無料の評価ライセンスを取得する

無料の一時ライセンスを取得して、評価制限なしでライブラリを試すことができます。

パスポート OCR API - 無料リソース

パスポートに対して OCR を実行するほかに、以下のリソースに従ってパスポート OCR API をさらに詳しく調べることもできます。

結論

この記事では、Python でパスポートに OCR を実行し、パスポートのテキストを読み取る方法を学びました。 OCR Passport 機能を Python プロジェクトに組み込むことで、パスポート情報を読み取るプロセスを自動化し、時間と労力を節約できます。これは、パスポート認証、旅行予約システム、国境管理プロセスなどのアプリケーションに特に役立ちます。不明な点がある場合は、無料サポート フォーラムまでお気軽にお問い合わせください。

関連項目