Технология оптического распознавания символов (OCR) позволяет пользователям извлекать текст из изображений и документов, что делает ее мощным инструментом для таких задач, как чтение паспортов. Выполнение оптического распознавания символов в паспортах может упростить процесс чтения и извлечения информации из паспортов. В этом сообщении блога мы научимся распознавать паспорта с помощью оптического распознавания символов и читать текст паспорта на Python.
В этой статье рассматриваются следующие темы:
- API распознавания паспортов в Python
- Паспорт OCR в Python
- Извлечь и сохранить текст паспорта
- Бесплатные ресурсы Python для распознавания текста
API OCR паспорта в Python
Мы будем использовать Aspose.OCR for Python для выполнения оптического распознавания изображений паспорта и чтения текста паспорта с изображений. Aspose.OCR for Python — это мощный API оптического распознавания символов (OCR), который позволяет вам добавлять возможности OCR в ваши приложения Python. Проще говоря, он помогает извлекать текст из изображений, PDF-файлов и других файлов.
Пожалуйста, загрузите пакет или установите API из PyPI, используя следующую команду pip в консоли:
pip install aspose-ocr-python-net
OCR Passport — чтение текста паспорта на Python
Мы можем выполнить распознавание изображений паспорта и прочитать распознанный текст, выполнив следующие действия:
- Создайте экземпляр класса AsposeOcr.
- Добавьте фильтры, используя объект класса PreprocessingFilter.
- Создайте экземпляр класса OcrInput.
- Добавьте изображения паспорта, используя метод add().
- Инициализируйте объект класса PassportRecognitionSettings.
- После этого запустите процесс распознавания с помощью метода распознавания паспорта().
- Наконец, покажите идентифицированный текст.
В следующем примере кода показано, как распознавать паспорта с помощью оптического распознавания символов и читать текст паспорта на Python.
import aspose.ocr as ocr
# инициализировать инженер OCR
api = ocr.AsposeOcr()
# добавить фильтры
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
# инициализировать коллекцию изображений и поместить в нее изображения
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")
# изменить параметры распознавания
settings = ocr.PassportRecognitionSettings()
# запустить распознавание
res = api.recognize_passport(passport, settings)
# результат печати
for result in res:
print(result.recognition_text)
Извлечение и сохранение текста паспорта в Python
Мы можем выполнить распознавание текста в паспорте и сохранить распознанный текст, выполнив шаги, упомянутые ранее. Однако нам просто нужно сохранить результат с помощью метода savemultipagedocument().В качестве аргументов он принимает путь к выходному файлу, формат выходного файла и объект результата распознавания.
В следующем примере кода показано, как выполнить паспортизацию OCR и сохранить распознанный текст в Python.
import aspose.ocr as ocr
# инициализировать инженер OCR
api = ocr.AsposeOcr()
# добавить фильтры
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
# инициализировать коллекцию изображений и поместить в нее изображения
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")
# изменить параметры распознавания
settings = ocr.PassportRecognitionSettings()
# запустить распознавание
res = api.recognize_passport(passport, settings)
# print("# Сохраняем исправленный текст")
api.save_multipage_document("sample_out.txt", ocr.SaveFormat.TEXT, res)
Получите бесплатную пробную лицензию
Вы можете получить бесплатную временную лицензию, чтобы опробовать библиотеку без ограничений ознакомительной версии.
API для распознавания паспортов — бесплатные ресурсы
Помимо выполнения оптического распознавания паспорта, вы можете дополнительно изучить API оптического распознавания паспорта, воспользовавшись приведенными ниже ресурсами:
- Руководство разработчика
- Бесплатные онлайн-приложения
- Справочник по API
- Практические руководства и статьи
Заключение
В этой статье мы узнали, как выполнять распознавание текста в паспортах и читать текст паспорта на Python. Включив функциональность OCR Passport в свои проекты Python, вы можете автоматизировать процесс чтения паспортной информации, сэкономив время и усилия. Это может быть особенно полезно для таких приложений, как проверка паспортов, системы бронирования поездок и процессы пограничного контроля. В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на нашем бесплатном форуме поддержки.