画像からテキストを手動で書き起こすのにうんざりしていませんか? 編集したいテキストを含むスキャンした文書、スクリーンショット、または画像のコレクションがある場合、もう探す必要はありません。 JPG または PNG 画像で OCR を簡単に実行し、テキストを抽出できます。 このブログ投稿では、Python で画像テキストを Word 文書に変換して、テキストデータの操作と操作を容易にする方法について説明します。 このガイドでは、画像からテキストを簡単に抽出するプロセスを順を追って説明し、DOCX 形式で保存する方法を示します。
この記事では、以下のトピックについて説明します。
Python OCR ライブラリを使用して画像テキストを Word に変換する
Python で画像テキストを Word に変換するには、Aspose.OCR for Python を使用します。これは、画像からテキストを抽出し、編集可能な Word 文書に変換するための強力で効率的なツールです。高度な OCR テクノロジにより、スキャンした文書、写真、スクリーンショットなど、さまざまな画像形式からテキストを正確に認識して抽出します。
パッケージをダウンロードするか、コンソールで次のpipコマンドを使用してPyPIからAPIをインストールしてください。
pip install aspose-ocr-python-net
Python で画像テキストを Word に変換する
画像からテキストを簡単に認識して読み取り、Word 文書に変換できます。プログラムで画像からテキストを抽出して編集するには、次の手順に従ってください。
- InputType.SINGLEIMAGE を引数として OcrInput クラス オブジェクトを初期化します。
- add() メソッドを使用して画像を追加します。
- AsposeOcr クラス オブジェクトのインスタンスを作成します。
- その後、OcrInput オブジェクトを引数として recognize() メソッドを呼び出します。
- 最後に、save() メソッドを使用して結果を DOCX ファイルとして保存します。
次のコードサンプルは、Python で画像テキストを Word 文書に変換する方法を示しています。
# このコード例は、Python で画像テキストを Word に変換する方法を示しています。
import aspose.ocr as ocr
# 認識バッチに画像を追加する
inputImg = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
inputImg.add("sample.jpg")
# Aspose.OCR API をインスタンス化する
api = ocr.AsposeOcr()
# 画像を認識する
result = api.recognize(inputImg)
# 印刷認識結果
print(result[0].recognition_text)
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX);
画像テキストをWordに変換 – 無料リソース
Python で画像テキストを Word に変換する機能をさらに活用したいですか? 以下のリソースをチェックして、ライブラリの機能の詳細を知り、他に何ができるかを確認してください。
Python OCR ライブラリ – 無料ライセンスを取得
画像テキストから Word への変換を無料で始めましょう。[一時ライセンス] ページにアクセスして、無料の一時ライセンスを取得する方法 を簡単に確認し、制限なしでライブラリを試すことができます。
結論
このブログ記事では、画像テキストを編集可能な Word 文書に変換する方法について説明しました。Aspose.OCR for Python を活用することで、画像からテキストを効率的に抽出して Word 形式に変換できるため、時間を節約し、生産性を高めることができます。このライブラリは 100 を超える言語をサポートし、柔軟な出力オプションを提供しているため、ドキュメント処理タスクを自動化したい開発者や企業に人気の選択肢となっています。このガイドで概説されている手順に従うと、プログラムで画像からテキストを抽出したり、ドキュメント処理タスクを自動化したり、スキャンしたドキュメントからデータを抽出したりできます。さあ、試してみて、プロジェクトで画像からテキストへの変換の可能性を解き放ちましょう。
ご不明な点がございましたら、無料サポートフォーラムからお気軽にお問い合わせください。