テキスト情報の処理と分析は、さまざまな分野で共通の要件です。ただし、画像上のテキストを扱うには特有の課題があります。幸いなことに、Aspose.OCR for Python via .NET は、このタスクに効率的に取り組むための強力なライブラリとツールを提供します。このブログ投稿では、Python で光学式文字認識 (OCR) 技術を使用して画像上のテキストを比較し、画像上のテキストの類似点または相違点をチェックする方法を説明します。
- 画像テキストを OCR と比較 – Python API のインストール
- Python の OCR を使用して画像上のテキストを比較する
- Python の OCR を使用して画像内のテキストの類似性を取得する
画像テキストを OCR と比較 – Python API のインストール
OCR は、画像、スキャンした文書、または手書きの資料からテキストを抽出できるテクノロジーです。コンピューター ビジョン アルゴリズムを使用して文字を識別し、機械可読テキストに変換します。 OCR は、テキストの比較や相違点や類似点の取得など、画像のテキスト分析を伴うタスクを自動化する際に重要な役割を果たします。 Aspose.OCR for Python は、New Releases セクションからアクセスするか、次のインストール コマンドを使用して PyPi からインストールすることで、.NET 経由で簡単に構成できます。
pip install aspose-ocr-python-net
Python の OCR を使用して画像上のテキストを比較する
異なる画像上のテキストを比較し、それらが類似しているかどうかを確認できます。出力は、True または False 値としてブール形式で生成されます。True はテキストが類似していることを意味し、False 値はテキストが類似していないことを意味します。 Python で OCR を使用して画像上のテキストを比較するには、以下の手順に従う必要があります。
- AsposeOcrクラスのオブジェクトを作成します。
- 比較のために入力画像を取得します。
- 画像内のテキストを比較し、結果を印刷します。
次のコード スニペットは、Python で画像内のテキストを OCR と比較する方法を示しています。
import aspose.ocr as ocr
# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()
# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()
input1 = "image1.jpg"
input2 = "image1.jpg"
# Recognize the image
result = api.compare_image_texts(input1, input2, settings, True)
# Print recognition result
print(result)
print("Images Compared Successfully")
Python の OCR を使用して画像内のテキストの類似性を取得する
以下の手順に従って、Python で画像内のテキストの類似点または相違点を取得できます。
- AsposeOcr クラスのインスタンスを初期化します。
- [RecognitionSettings][5] クラス オブジェクトをインスタンス化します。
- 画像内のテキストの違いを計算します。
- 出力結果を印刷します。
以下のコード スニペットは、Python で画像内のテキストの類似点または相違点を取得する方法を説明しています。
import aspose.ocr as ocr
# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()
# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()
input1 = "image1.jpg"
input2 = "image1.jpg"
input3 = "image2.jpg"
# Check difference
result = api.image_text_diff(input1, input2, settings, True)
# Print 1 - equal, 0 - maximum difference
print("Image Texts are " + str(result*100) + "% similar")
# Check difference
result = api.image_text_diff(input1, input3, settings, True)
# Print 1 - equal, 0 - maximum difference
print(result)
print("Image Texts are " + str(result*100) + "% similar")
無料の評価ライセンスを取得する
API のすべての機能を最大限にテストするには、無料の一時ライセンス をリクエストできます。
まとめ
Python の OCR 技術を使用して画像上のテキストを比較すると、さまざまな分野で幅広い可能性が広がります。画像からテキストを簡単に抽出して比較し、違いや類似点を見つけることができます。ドキュメント分析、コンテンツ検証、盗作検出のいずれに取り組んでいる場合でも、このアプローチによりテキスト比較ワークフローが合理化されます。ご不明な点がございましたら、無料サポートフォーラムよりお気軽にお問い合わせください。