OCR-паспорт в Python | Читать паспорт | API распознавания паспортов

Технология оптического распознавания символов (OCR) позволяет пользователям извлекать текст из изображений и документов, что делает ее мощным инструментом для таких задач, как чтение паспортов. Выполнение оптического распознавания символов в паспортах может упростить процесс чтения и извлечения информации из паспортов. В этом сообщении блога мы научимся распознавать паспорта с помощью оптического распознавания символов и читать текст паспорта на Python.

В этой статье рассматриваются следующие темы:

  1. API распознавания паспортов в Python
  2. Паспорт OCR в Python
  3. Извлечь и сохранить текст паспорта
  4. Бесплатные ресурсы Python для распознавания текста

API OCR паспорта в Python

Мы будем использовать Aspose.OCR for Python для выполнения оптического распознавания изображений паспорта и чтения текста паспорта с изображений. Aspose.OCR for Python — это мощный API оптического распознавания символов (OCR), который позволяет вам добавлять возможности OCR в ваши приложения Python. Проще говоря, он помогает извлекать текст из изображений, PDF-файлов и других файлов.

Пожалуйста, загрузите пакет или установите API из PyPI, используя следующую команду pip в консоли:

pip install aspose-ocr-python-net

OCR Passport — чтение текста паспорта на Python

Мы можем выполнить распознавание изображений паспорта и прочитать распознанный текст, выполнив следующие действия:

  1. Создайте экземпляр класса AsposeOcr.
  2. Добавьте фильтры, используя объект класса PreprocessingFilter.
  3. Создайте экземпляр класса OcrInput.
  4. Добавьте изображения паспорта, используя метод add().
  5. Инициализируйте объект класса PassportRecognitionSettings.
  6. После этого запустите процесс распознавания с помощью метода распознавания паспорта().
  7. Наконец, покажите идентифицированный текст.

В следующем примере кода показано, как распознавать паспорта с помощью оптического распознавания символов и читать текст паспорта на Python.

import aspose.ocr as ocr

# инициализировать инженер OCR
api = ocr.AsposeOcr()

# добавить фильтры
filters = ocr.models.preprocessingfilters.PreprocessingFilter()

# инициализировать коллекцию изображений и поместить в нее изображения
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")

# изменить параметры распознавания
settings = ocr.PassportRecognitionSettings()

# запустить распознавание
res = api.recognize_passport(passport, settings)

# результат печати
for result in res:
    print(result.recognition_text)

Извлечение и сохранение текста паспорта в Python

Мы можем выполнить распознавание текста в паспорте и сохранить распознанный текст, выполнив шаги, упомянутые ранее. Однако нам просто нужно сохранить результат с помощью метода savemultipagedocument().В качестве аргументов он принимает путь к выходному файлу, формат выходного файла и объект результата распознавания.

В следующем примере кода показано, как выполнить паспортизацию OCR и сохранить распознанный текст в Python.

import aspose.ocr as ocr

# инициализировать инженер OCR
api = ocr.AsposeOcr()

# добавить фильтры
filters = ocr.models.preprocessingfilters.PreprocessingFilter()

# инициализировать коллекцию изображений и поместить в нее изображения
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")

# изменить параметры распознавания
settings = ocr.PassportRecognitionSettings()

# запустить распознавание
res = api.recognize_passport(passport, settings)

# print("# Сохраняем исправленный текст")
api.save_multipage_document("sample_out.txt", ocr.SaveFormat.TEXT, res)

Получите бесплатную пробную лицензию

Вы можете получить бесплатную временную лицензию, чтобы опробовать библиотеку без ограничений ознакомительной версии.

API для распознавания паспортов — бесплатные ресурсы

Помимо выполнения оптического распознавания паспорта, вы можете дополнительно изучить API оптического распознавания паспорта, воспользовавшись приведенными ниже ресурсами:

Заключение

В этой статье мы узнали, как выполнять распознавание текста в паспортах и читать текст паспорта на Python. Включив функциональность OCR Passport в свои проекты Python, вы можете автоматизировать процесс чтения паспортной информации, сэкономив время и усилия. Это может быть особенно полезно для таких приложений, как проверка паспортов, системы бронирования поездок и процессы пограничного контроля. В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на нашем бесплатном форуме поддержки.

Смотрите также