Python で画像からテキストを作成する | Python 画像からテキストを作成する

画像からテキストを編集可能な形式に変換することは、さまざまなアプリケーションにとって重要なタスクです。スキャンした文書、名刺、手書きのメモなどを扱う場合でも、画像からテキストを抽出すると、大幅に時間を節約し、生産性を向上させることができます。このブログ記事では、Python で画像からテキストをテキストに変換する方法を学びます。

この記事では、以下のトピックについて説明します。

Python 画像テキストからテキストへのコンバーター

Aspose.OCR for Python を使用して、画像からテキスト (TXT) に変換します。Aspose.OCR for Python は、開発者が Python アプリケーションで画像やスキャンしたドキュメントからテキストを抽出できるようにする強力な光学式文字認識 (OCR) ライブラリです。

まず、Aspose.OCR ライブラリをインストールする必要があります。コンソールで次の pip コマンドを使用して、パッケージをダウンロード したり、PyPI から API をインストールしたりすることができます。

pip install aspose-ocr-python-net 

Python で画像からテキストに変換する

画像からテキストを変換し、テキスト (TXT) ファイルに保存できます。プログラムで画像からテキストを抽出し、テキスト ファイルとして保存するには、以下の手順に従ってください。

  1. AsposeOcr クラス オブジェクトのインスタンスを作成します。
  2. InputType.SINGLEIMAGE を引数として OcrInput クラス オブジェクトをインスタンス化します。
  3. add() メソッドを使用して画像を追加します。同様に、さらに画像を追加します。
  4. その後、OcrInput オブジェクトを引数として recognize() メソッドを呼び出します。
  5. 最後に、save() メソッドを使用して結果をテキスト ファイルとして保存します。

次のコードサンプルは、Python で画像からテキストをテキスト ファイルに変換する方法を示しています。

# このコード例は、画像からテキストを抽出し、Pythonでテキストファイルとして保存する方法を示しています。
import aspose.ocr as ocr

# Aspose.OCR API をインスタンス化する
api = ocr.AsposeOcr()

# 認識バッチに画像を追加する
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")

# 画像を認識する
result = api.recognize(img)

# 印刷認識結果
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Python で画像からテキストに変換するテキスト コンバーター。

Python で画像からテキストに変換するテキスト コンバーター。

画像からテキストへ - 高度な方法

同様に、テキストを画像からテキスト ファイルに変換するときに、「自動傾斜」などのフィルターを追加したり、領域モード、言語などの認識オプションを設定したりできます。フィルターと認識設定を追加するには、以下の手順に従ってください。

  1. AsposeOcr クラス オブジェクトのインスタンスを作成します。
  2. PreprocessingFilters クラスのオブジェクトを初期化します。
  3. add() メソッドを使用してフィルターを追加します。
  4. InputType.SINGLEIMAGE とフィルター オブジェクトを引数として、OcrInput クラス オブジェクトをインスタンス化します。
  5. add() メソッドを使用して画像を追加します。同様に、さらに画像を追加します。
  6. RecognitionSettings クラス オブジェクトを初期化します。
  7. 認識オプションを指定します。
  8. その後、OcrInput オブジェクトを引数として recognize() メソッドを呼び出します。
  9. 最後に、save() メソッドを使用して結果をテキスト ファイルとして保存します。

次のコード サンプルは、Python で画像からテキスト ファイルにテキストを変換するためのフィルターと認識設定を指定する方法を示しています。

# このコード例は、画像から英語のテキストを抽出し、Pythonでテキストファイルとして保存する方法を示しています。
import aspose.ocr as ocr

# Aspose.OCR API をインスタンス化する
api = ocr.AsposeOcr()

# 前処理オプションを設定する
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())

# 認識バッチに画像を追加する
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")

# 認識オプションを設定する
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG

# 認識する
result = api.recognize(img, settings)

# 印刷認識結果
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);

Python OCR ライブラリ – 無料ライセンスを取得

「一時ライセンス」ページにアクセスして、簡単に無料ライセンスを取得して、Python OCR ライブラリへの無制限アクセスを解除する方法を学んでください。今すぐ画像からテキスト ファイルへの変換を始めましょう。

画像テキストからテキストへのコンバーター – 無料リソース

ライブラリの機能と能力について詳しく知るには、以下のリソースを参照してください。

結論

このブログ記事では、Aspose.OCR for Python を使用して画像からテキストを TXT ファイルに変換する方法を説明しました。上記の手順に従うことで、OCR 機能を Python アプリケーションに簡単に統合し、さまざまな種類の画像からテキストを抽出して処理できるようになります。ドキュメントのデジタル化、データ抽出、その他の OCR 関連のタスクのいずれに取り組んでいる場合でも、Aspose.OCR は信頼性が高く効率的なソリューションを提供します。コーディングをお楽しみください。

ご不明な点がございましたら、無料サポートフォーラムからお気軽にお問い合わせください。

参照