今日のデジタル世界では、画像からテキストを抽出することがさまざまなアプリケーションで一般的な要件になっています。スキャンしたドキュメントを処理する必要がある場合でも、分析のために画像からテキストを抽出する必要がある場合でも、データ入力タスクを自動化する必要がある場合でも、画像をテキストに変換できれば、貴重な時間と労力を節約できます。このブログ投稿では、Python を使用して画像をテキストに変換する方法を説明します。
OCR を使用してスクリーンショットをテキストに変換 – Python API のインストール
Aspose.OCR for Python via .NET API は、Python アプリケーションとシームレスに統合する、強力でユーザーフレンドリーな光学式文字認識 (OCR) エンジンを提供します。数行の簡潔なコード スニペットを使用すると、ラテン文字、キリル文字、アジア文字を使用して 28 の言語にわたるテキストを識別できると同時に、広く使用されているドキュメントおよびデータ交換形式で結果を簡単に取得できるようになります。 API はこれらのタスクを処理するための簡単で信頼性の高いソリューションを提供するため、複雑な数学モデルを把握したり、機械学習アルゴリズムを構築したり、ニューラル ネットワークをトレーニングしたりする必要がなくなります。 リリース セクションからダウンロードするか、次のインストール コマンドを使用して PyPi からインストールできます。
pip install aspose-ocr-python-net
Python の OCR を使用して画像をテキストに変換する
以下の手順で Python で OCR を実行することで、画像をテキストに変換できます。
- Aspose.Ocr 名前空間を使用して Aspose.OCR API をインスタンス化します。
- 認識用の画像を追加します。
- 画像を認識し、認識したテキストを印刷します。
さらに、次の画像は、Python を使用して画像内のテキストを認識する OCR の機能を示す入力画像として使用されています。
以下のコード スニペットは、Python で画像をテキストに変換する方法を示しています。
import aspose.ocr as ocr
# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()
# Add image to the recognition batch
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
input.add("source.png")
# Recognize the image
result = api.recognize(input)
# Print recognition result
print(result[0].recognition_text)
オンラインで画像をテキストに変換
画像からテキストへのオンライン変換は、特別なソフトウェアや技術的専門知識を必要とせずに、画像をテキストに変換する便利でユーザーフレンドリーな方法を提供します。時間を節約するだけでなく、情報へのアクセス、編集、検索のしやすさも向上します。
このオンライン OCR テキスト認識の注目すべき重要な機能は、複数の辞書に対して自動テキスト修正を実行し、出力結果を DOCX、TXT、PDF などのさまざまな形式でダウンロードできることです。
無料の評価ライセンスを取得する
無料の一時ライセンスを取得して、制限なしで API を最大限に評価することができます。
結論
Python と OCR ライブラリを使用して画像をテキストに変換すると、データ抽出を自動化し、アクセシビリティを向上させ、ビジュアル コンテンツから貴重な洞察を引き出すことができます。この強力なライブラリを利用できるようになったことで、画像からテキストへの変換をアプリケーションに統合することがこれまでより簡単になりました。ご質問がある場合は、無料サポート フォーラム 経由でお気軽にお問い合わせください。