So sánh văn bản hình ảnh OCR Python

Xử lý và phân tích thông tin văn bản là một yêu cầu phổ biến trong các lĩnh vực khác nhau. Tuy nhiên, xử lý văn bản trên hình ảnh là một thách thức độc đáo. May mắn thay, Aspose.OCR for Python qua .NET cung cấp các thư viện và công cụ mạnh mẽ để giải quyết tác vụ này một cách hiệu quả. Trong bài đăng trên blog này, bạn sẽ khám phá cách so sánh văn bản trên hình ảnh trong Python bằng kỹ thuật Nhận dạng ký tự quang học (OCR) cũng như kiểm tra sự giống hoặc khác nhau của văn bản trên hình ảnh.

So sánh văn bản hình ảnh với OCR – Cài đặt API Python

OCR là công nghệ cho phép trích xuất văn bản từ hình ảnh, tài liệu được quét hoặc tài liệu viết tay. Nó sử dụng các thuật toán thị giác máy tính để xác định các ký tự và chuyển đổi chúng thành văn bản có thể đọc được bằng máy. OCR đóng một vai trò quan trọng trong việc tự động hóa các tác vụ liên quan đến phân tích văn bản của hình ảnh, chẳng hạn như so sánh văn bản hoặc nhận ra sự khác biệt hoặc tương đồng. Bạn có thể dễ dàng định cấu hình Aspose.OCR for Python qua .NET bằng cách truy cập nó từ phần Bản phát hành mới hoặc cài đặt nó từ PyPi bằng lệnh cài đặt sau:

pip install aspose-ocr-python-net

So sánh Văn bản trên Hình ảnh với OCR trong Python

Bạn có thể so sánh văn bản trên các hình ảnh khác nhau và tìm xem chúng có giống nhau hay không. Đầu ra được tạo ở định dạng Boolean dưới dạng giá trị Đúng hoặc Sai trong đó Đúng có nghĩa là văn bản tương tự và giá trị Sai có nghĩa là văn bản không giống nhau. Bạn cần làm theo các bước bên dưới để so sánh văn bản trên hình ảnh với OCR trong Python:

  1. Tạo một đối tượng thuộc lớp AsposeOcr.
  2. Lấy hình ảnh đầu vào để so sánh.
  3. So sánh văn bản trong hình ảnh và in kết quả.

Đoạn mã sau minh họa cách so sánh văn bản trong hình ảnh với OCR trong Python:

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()

input1 = "image1.jpg"
input2 = "image1.jpg"

# Recognize the image
result = api.compare_image_texts(input1, input2, settings, True)

# Print recognition result
print(result)
print("Images Compared Successfully")

Nhận độ tương tự của văn bản trong hình ảnh với OCR trong Python

Bạn có thể nhận được sự tương đồng hoặc khác biệt của văn bản trong hình ảnh trong Python bằng cách thực hiện theo các bước bên dưới:

  1. Khởi tạo một thể hiện của lớp AsposeOcr.
  2. Khởi tạo đối tượng lớp [RecognitionSettings][5].
  3. Tính toán sự khác biệt trong văn bản trong hình ảnh.
  4. In kết quả đầu ra.

Đoạn mã dưới đây giải thích cách nhận điểm tương đồng hoặc khác biệt trong văn bản trong hình ảnh bằng Python:

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()

input1 = "image1.jpg"
input2 = "image1.jpg"
input3 = "image2.jpg"

# Check difference
result = api.image_text_diff(input1, input2, settings, True)

# Print 1 - equal, 0 - maximum difference
print("Image Texts are " + str(result*100) + "% similar")


# Check difference
result = api.image_text_diff(input1, input3, settings, True)

# Print 1 - equal, 0 - maximum difference
print(result)
print("Image Texts are " + str(result*100) + "% similar")

Nhận giấy phép đánh giá miễn phí

Bạn có thể yêu cầu giấy phép tạm thời miễn phí để thử nghiệm tất cả các tính năng của API với toàn bộ khả năng của chúng.

Tổng hợp

So sánh văn bản trên hình ảnh bằng kỹ thuật OCR trong Python mở ra nhiều khả năng trong các lĩnh vực khác nhau. Bạn có thể dễ dàng trích xuất văn bản từ hình ảnh, so sánh nó và nhận ra sự khác biệt hoặc tương đồng. Cho dù bạn đang phân tích tài liệu, xác minh nội dung hay phát hiện đạo văn, phương pháp này sẽ hợp lý hóa quy trình so sánh văn bản của bạn. Trong trường hợp có bất kỳ thắc mắc nào, vui lòng liên hệ với chúng tôi qua diễn đàn hỗ trợ miễn phí.

Xem thêm