Chuyển hình ảnh thành văn bản OCR Python

Trong thế giới kỹ thuật số ngày nay, việc trích xuất văn bản từ hình ảnh đã trở thành một yêu cầu phổ biến trong các ứng dụng khác nhau. Cho dù bạn cần xử lý tài liệu được quét, trích xuất văn bản từ hình ảnh để phân tích hay tự động hóa các tác vụ nhập dữ liệu, khả năng chuyển đổi hình ảnh thành văn bản có thể giúp bạn tiết kiệm thời gian và công sức quý báu. Trong bài đăng trên blog này, chúng ta sẽ khám phá cách chuyển đổi hình ảnh thành văn bản bằng Python.

Ảnh chụp màn hình thành văn bản với OCR – Cài đặt API Python

Aspose.OCR for Python qua .NET API trình bày một công cụ nhận dạng ký tự quang học (OCR) mạnh mẽ và thân thiện với người dùng, tích hợp liền mạch với các ứng dụng Python của bạn. Với một đoạn mã ngắn gọn gồm một vài dòng, bạn có khả năng nhận dạng văn bản trên 28 ngôn ngữ bằng cách sử dụng chữ viết Latinh, Cyrillic và Châu Á, đồng thời dễ dàng thu được kết quả ở các định dạng trao đổi dữ liệu và tài liệu được sử dụng rộng rãi. Không cần thiết phải nắm bắt các mô hình toán học phức tạp, xây dựng thuật toán học máy hoặc đào tạo mạng thần kinh vì API cung cấp giải pháp đơn giản và đáng tin cậy để xử lý các tác vụ này. Bạn có thể tải xuống từ phần Release hoặc cài đặt từ PyPi bằng lệnh cài đặt sau:

pip install aspose-ocr-python-net

Chuyển đổi hình ảnh thành văn bản bằng OCR trong Python

Bạn có thể chuyển đổi hình ảnh thành văn bản bằng cách thực hiện OCR trong Python theo các bước bên dưới:

  1. Khởi tạo API Aspose.OCR với không gian tên Aspose.Ocr.
  2. Thêm hình ảnh để nhận dạng.
  3. Nhận dạng hình ảnh và in văn bản được nhận dạng.

Ngoài ra, hình ảnh sau đây được sử dụng làm hình ảnh đầu vào để thể hiện khả năng nhận dạng văn bản trong hình ảnh của OCR bằng Python.

Nhận dạng văn bản trong hình ảnh bằng OCR Python

Đoạn mã dưới đây cho thấy cách chuyển đổi hình ảnh thành văn bản trong Python:

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Add image to the recognition batch
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
input.add("source.png")

# Recognize the image
result = api.recognize(input)

# Print recognition result
print(result[0].recognition_text)

Chuyển đổi hình ảnh thành văn bản trực tuyến

Chuyển đổi trực tuyến hình ảnh thành văn bản cung cấp một cách thuận tiện và thân thiện với người dùng để chuyển đổi hình ảnh thành văn bản mà không cần phần mềm chuyên dụng hoặc chuyên môn kỹ thuật. Nó không chỉ tiết kiệm thời gian mà còn cho phép khả năng truy cập, chỉnh sửa và tìm kiếm thông tin tốt hơn.

Một tính năng đáng chú ý và quan trọng của nhận dạng văn bản OCR trực tuyến này là bạn có thể thực hiện chỉnh sửa văn bản tự động cho một số từ điển và tải xuống kết quả đầu ra ở các định dạng khác nhau như DOCX, TXT, PDF, v.v.

Nhận giấy phép đánh giá miễn phí

Bạn có thể nhận giấy phép tạm thời miễn phí để đánh giá toàn bộ khả năng của API mà không có bất kỳ giới hạn nào.

Phần kết luận

Chuyển đổi hình ảnh thành văn bản bằng thư viện Python và OCR cho phép bạn tự động hóa việc trích xuất dữ liệu, cải thiện khả năng truy cập và khám phá những hiểu biết có giá trị từ nội dung trực quan. Với sự sẵn có của thư viện mạnh mẽ này, việc tích hợp chuyển đổi hình ảnh thành văn bản vào các ứng dụng của bạn trở nên dễ dàng hơn bao giờ hết. Trong trường hợp bạn muốn thảo luận về bất kỳ thắc mắc nào của mình, vui lòng liên hệ với chúng tôi qua diễn đàn hỗ trợ miễn phí.

Xem thêm