光学字符识别 (OCR) 技术允许用户从图像和文档中提取文本,使其成为读取护照等任务的强大工具。对护照执行 OCR 可以简化读取和提取护照信息的过程。在这篇博文中,我们将学习如何使用 Python 来 OCR 护照并读取护照文本。
本文涵盖以下主题:
Python 中的护照 OCR API
我们将使用 Aspose.OCR for Python 对护照图像执行 OCR 并从图像中读取护照文本。 Aspose.OCR for Python 是一个强大的光学字符识别 (OCR) API,允许您向 Python 应用程序添加 OCR 功能。简单来说,它可以帮助您从图像、PDF 和其他文件中提取文本。
请下载软件包或在控制台中使用以下 pip 命令从 PyPI 安装 API:
pip install aspose-ocr-python-net
OCR Passport - 用 Python 读取护照文本
我们可以按照以下步骤对护照图片进行OCR识别并读取识别出的文字:
- 创建 AsposeOcr 类的实例。
- 使用 PreprocessingFilter 类对象添加过滤器。
- 创建 OcrInput 类的实例。
- 使用 add() 方法添加护照图像。
- 初始化 PassportRecognitionSettings 类的对象。
- 之后,使用 recognizepassport() 方法运行识别过程。
- 最后,显示识别出的文本。
以下示例代码演示了如何使用 Python 对护照进行 OCR 并读取护照文本。
import aspose.ocr as ocr
# 初始化 OCR 引擎
api = ocr.AsposeOcr()
# 添加过滤器
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
# 初始化图像集合并将图像放入其中
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")
# 更改识别选项
settings = ocr.PassportRecognitionSettings()
# 跑步识别
res = api.recognize_passport(passport, settings)
# 打印结果
for result in res:
print(result.recognition_text)
在 Python 中提取并保存护照文本
我们可以按照前面提到的步骤对护照进行 OCR 并保存识别的文本。但是,我们只需要使用 savemultipagedocument() 方法保存结果。它将输出文件路径、输出文件格式和识别结果对象作为参数。
以下示例代码展示了如何对护照进行 OCR 识别并在 Python 中保存识别的文本。
import aspose.ocr as ocr
# 初始化 OCR 引擎
api = ocr.AsposeOcr()
# 添加过滤器
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
# 初始化图像集合并将图像放入其中
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")
# 更改识别选项
settings = ocr.PassportRecognitionSettings()
# 跑步识别
res = api.recognize_passport(passport, settings)
# print("#保存修改后的文本")
api.save_multipage_document("sample_out.txt", ocr.SaveFormat.TEXT, res)
获取免费评估许可证
您可以获得免费的临时许可证来试用该库,而不受评估限制。
护照 OCR API - 免费资源
除了对护照进行 OCR 之外,您还可以通过以下资源进一步探索护照 OCR API:
结论
在本文中,我们学习了如何在护照上执行 OCR 并使用 Python 读取护照文本。通过将 OCR Passport 功能合并到您的 Python 项目中,您可以自动化读取护照信息的过程,从而节省时间和精力。这对于护照验证、旅行预订系统和边境管制流程等应用特别有用。如有任何疑问,请随时通过我们的免费支持论坛与我们联系。