Công nghệ Nhận dạng ký tự quang học (OCR) cho phép người dùng trích xuất văn bản từ hình ảnh và tài liệu, khiến nó trở thành một công cụ mạnh mẽ cho các tác vụ như đọc hộ chiếu. Thực hiện OCR trên hộ chiếu có thể đơn giản hóa quá trình đọc và trích xuất thông tin từ hộ chiếu. Trong bài đăng trên blog này, chúng ta sẽ tìm hiểu cách OCR hộ chiếu và đọc văn bản hộ chiếu bằng Python.
Bài viết này bao gồm các chủ đề sau:
- API OCR hộ chiếu bằng Python
- Hộ chiếu OCR bằng Python
- Trích xuất và lưu văn bản hộ chiếu
- Tài nguyên OCR Python miễn phí
API OCR hộ chiếu bằng Python
Chúng tôi sẽ sử dụng Aspose.OCR for Python để thực hiện OCR trên ảnh hộ chiếu và đọc văn bản hộ chiếu từ hình ảnh. Aspose.OCR for Python là API nhận dạng ký tự quang học (OCR) mạnh mẽ cho phép bạn thêm các khả năng OCR vào các ứng dụng Python của mình. Nói một cách đơn giản hơn, nó giúp bạn trích xuất văn bản từ hình ảnh, tệp PDF và các tệp khác.
Vui lòng tải xuống gói hoặc cài đặt API từ PyPI bằng lệnh pip sau trong bảng điều khiển:
pip install aspose-ocr-python-net
Hộ chiếu OCR - Đọc văn bản hộ chiếu bằng Python
Chúng ta có thể thực hiện OCR trên ảnh hộ chiếu và đọc văn bản được nhận dạng bằng cách thực hiện theo các bước dưới đây:
- Tạo một phiên bản của lớp AsposeOcr.
- Thêm bộ lọc bằng cách sử dụng đối tượng lớp PreprocessingFilter.
- Tạo một thể hiện của lớp OcrInput.
- Thêm (các) hình ảnh hộ chiếu bằng phương thức add().
- Khởi tạo một đối tượng của lớp PassportRecognitionSettings.
- Sau đó, chạy quy trình nhận dạng bằng phương thức nhận dạng hộ chiếu().
- Cuối cùng, hiển thị văn bản được xác định.
Mã mẫu sau đây cho biết cách OCR hộ chiếu và đọc văn bản hộ chiếu bằng Python.
import aspose.ocr as ocr
# khởi tạo kỹ sư OCR
api = ocr.AsposeOcr()
# thêm bộ lọc
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
# khởi tạo bộ sưu tập hình ảnh và đưa hình ảnh vào đó
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")
# thay đổi tùy chọn nhận dạng
settings = ocr.PassportRecognitionSettings()
# nhận dạng chạy
res = api.recognize_passport(passport, settings)
# kết quả in
for result in res:
print(result.recognition_text)
Trích xuất và lưu văn bản hộ chiếu bằng Python
Chúng tôi có thể thực hiện OCR trên hộ chiếu và lưu văn bản được nhận dạng bằng cách làm theo các bước được đề cập trước đó. Tuy nhiên chúng ta chỉ cần lưu kết quả bằng phương thức savemultipagedocument() là được. Nó lấy đường dẫn tệp đầu ra, định dạng tệp đầu ra và đối tượng kết quả nhận dạng làm đối số.
Mã mẫu sau đây cho biết cách OCR hộ chiếu và lưu văn bản được nhận dạng bằng Python.
import aspose.ocr as ocr
# khởi tạo kỹ sư OCR
api = ocr.AsposeOcr()
# thêm bộ lọc
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
# khởi tạo bộ sưu tập hình ảnh và đưa hình ảnh vào đó
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")
# thay đổi tùy chọn nhận dạng
settings = ocr.PassportRecognitionSettings()
# nhận dạng chạy
res = api.recognize_passport(passport, settings)
# print("# Lưu văn bản đã sửa")
api.save_multipage_document("sample_out.txt", ocr.SaveFormat.TEXT, res)
Nhận giấy phép đánh giá miễn phí
Bạn có thể nhận giấy phép tạm thời miễn phí để dùng thử thư viện mà không bị giới hạn về đánh giá.
API OCR hộ chiếu - Tài nguyên miễn phí
Bên cạnh việc thực hiện OCR trên hộ chiếu, bạn có thể khám phá thêm API OCR của hộ chiếu bằng cách thực hiện theo các tài nguyên bên dưới:
- Hướng dẫn dành cho nhà phát triển
- Ứng dụng trực tuyến miễn phí
- Tham chiếu API
- Hướng dẫn cách thực hiện và bài viết
Phần kết luận
Trong bài viết này, chúng ta đã tìm hiểu cách thực hiện OCR trên hộ chiếu và đọc văn bản hộ chiếu bằng Python. Bằng cách kết hợp chức năng OCR Passport vào các dự án Python của mình, bạn có thể tự động hóa quá trình đọc thông tin hộ chiếu, tiết kiệm thời gian và công sức. Điều này có thể đặc biệt hữu ích cho các ứng dụng như xác minh hộ chiếu, hệ thống đặt vé du lịch và quy trình kiểm soát biên giới. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn hỗ trợ miễn phí của chúng tôi.