光學字元辨識 (OCR) 技術允許使用者從圖像和文件中提取文本,使其成為讀取護照等任務的強大工具。對護照執行 OCR 可以簡化讀取和提取護照資訊的過程。在這篇文章中,我們將學習如何使用 Python 來 OCR 護照並讀取護照文字。
本文涵蓋以下主題:
Python 中的護照 OCR API
我們將使用 Aspose.OCR for Python 對護照圖像執行 OCR 並從圖像中讀取護照文字。 Aspose.OCR for Python 是一個強大的光學字元辨識 (OCR) API,可讓您為 Python 應用程式新增 OCR 功能。簡單來說,它可以幫助您從圖像、PDF 和其他文件中提取文字。
請下載軟體包或在控制台中使用以下 pip 命令從 PyPI 安裝 API:
pip install aspose-ocr-python-net
OCR Passport - 用 Python 讀取護照文本
我們可以依照以下步驟對護照圖片進行OCR辨識並讀取辨識出的文字:
- 建立 AsposeOcr 類別的實例。
- 使用 PreprocessingFilter 類別物件新增篩選器。
- 建立 OcrInput 類別的實例。
- 使用 add() 方法新增護照影像。
- 初始化 PassportRecognitionSettings 類別的物件。
- 之後,使用 recognizepassport() 方法運行辨識過程。
- 最後,顯示識別的文字。
以下範例程式碼示範如何使用 Python 對護照進行 OCR 並讀取護照文字。
import aspose.ocr as ocr
# 初始化 OCR 引擎
api = ocr.AsposeOcr()
# 新增過濾器
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
# 初始化圖像集合並將圖像放入其中
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")
# 更改識別選項
settings = ocr.PassportRecognitionSettings()
# 跑步識別
res = api.recognize_passport(passport, settings)
# 列印結果
for result in res:
print(result.recognition_text)
在 Python 中提取並保存護照文本
我們可以按照前面提到的步驟對護照進行 OCR 並保存識別的文本。但是,我們只需要使用 savemultipagedocument() 方法來儲存結果。它將輸出檔案路徑、輸出檔案格式和識別結果物件作為參數。
以下範例程式碼展示如何對護照進行 OCR 識別並在 Python 中保存識別的文字。
import aspose.ocr as ocr
# 初始化 OCR 引擎
api = ocr.AsposeOcr()
# 新增過濾器
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
# 初始化圖像集合並將圖像放入其中
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")
# 更改識別選項
settings = ocr.PassportRecognitionSettings()
# 跑步識別
res = api.recognize_passport(passport, settings)
# print("#儲存修改後的文字")
api.save_multipage_document("sample_out.txt", ocr.SaveFormat.TEXT, res)
取得免費評估許可證
您可以獲得免費的臨時許可證來試用該庫,而不受評估限制。
護照 OCR API - 免費資源
除了對護照進行 OCR 之外,您還可以透過以下資源進一步探索護照 OCR API:
結論
在本文中,我們學習瞭如何在護照上執行 OCR 並使用 Python 讀取護照文字。透過將 OCR Passport 功能合併到您的 Python 專案中,您可以自動化讀取護照資訊的過程,從而節省時間和精力。這對於護照驗證、旅行預訂系統和邊境管制流程等應用特別有用。如有任何疑問,請隨時透過我們的免費支援論壇與我們聯繫。