Chuyển văn bản từ hình ảnh sang văn bản trong Python | Văn bản hình ảnh Python thành văn bản

Chuyển đổi văn bản từ hình ảnh sang các định dạng có thể chỉnh sửa là một nhiệm vụ quan trọng đối với nhiều ứng dụng khác nhau. Cho dù bạn đang làm việc với tài liệu được quét, danh thiếp hay ghi chú viết tay, việc trích xuất văn bản từ hình ảnh có thể tiết kiệm đáng kể thời gian và nâng cao năng suất. Trong bài đăng trên blog này, chúng ta sẽ tìm hiểu cách chuyển đổi văn bản từ hình ảnh thành văn bản bằng Python.

Bài viết này bao gồm các chủ đề sau:

Chuyển đổi văn bản hình ảnh thành văn bản Python

Chúng tôi sẽ sử dụng Aspose.OCR for Python để chuyển đổi văn bản từ hình ảnh sang văn bản (TXT).Aspose.OCR for Python là thư viện Nhận dạng ký tự quang học (OCR) mạnh mẽ cho phép các nhà phát triển trích xuất văn bản từ hình ảnh và tài liệu được quét trong ứng dụng Python.

Đầu tiên, chúng ta cần cài đặt thư viện Aspose.OCR. Bạn có thể dễ dàng tải gói xuống hoặc cài đặt API từ PyPI bằng lệnh pip sau trong bảng điều khiển:

pip install aspose-ocr-python-net 

Chuyển đổi văn bản từ hình ảnh thành văn bản trong Python

Chúng ta có thể chuyển đổi văn bản từ hình ảnh và lưu nó thành tệp văn bản (TXT).Vui lòng làm theo các bước bên dưới để trích xuất văn bản từ hình ảnh theo chương trình và lưu dưới dạng tệp văn bản.

  1. Tạo một thể hiện của đối tượng lớp AsposeOcr.
  2. Khởi tạo đối tượng lớp OcrInput với inputType.SINGLEIMAGE làm đối số.
  3. Thêm hình ảnh bằng phương thức add().Tương tự, thêm nhiều hình ảnh hơn.
  4. Sau đó, gọi phương thức nhận dạng() với đối tượng OcrInput làm đối số.
  5. Cuối cùng, lưu kết quả dưới dạng tệp văn bản bằng phương thức save().

Mẫu mã sau đây cho biết cách chuyển đổi văn bản từ hình ảnh sang tệp văn bản trong Python.

# Ví dụ mã này cho thấy cách trích xuất văn bản từ hình ảnh và lưu dưới dạng tệp văn bản trong Python
import aspose.ocr as ocr

# Khởi tạo API Aspose.OCR
api = ocr.AsposeOcr()

# Thêm hình ảnh vào lô nhận dạng
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")

# Nhận biết hình ảnh
result = api.recognize(img)

# Kết quả nhận dạng in
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Chuyển đổi văn bản từ hình ảnh sang văn bản trong Python.

Chuyển đổi văn bản từ hình ảnh sang văn bản trong Python.

Chuyển văn bản từ hình ảnh sang văn bản - Phương pháp nâng cao

Tương tự, chúng ta có thể thêm các bộ lọc như “autoskew” và đặt các tùy chọn nhận dạng như mã vùng, ngôn ngữ, v.v. trong khi chuyển đổi văn bản từ hình ảnh sang tệp văn bản. Vui lòng làm theo các bước bên dưới để thêm bộ lọc và cài đặt nhận dạng.

  1. Tạo một thể hiện của đối tượng lớp AsposeOcr.
  2. Khởi tạo một đối tượng của lớp PreprocessingFilters.
  3. Thêm bộ lọc bằng phương thức add().
  4. Khởi tạo đối tượng lớp OcrInput bằng inputType.SINGLEIMAGE và lọc đối tượng làm đối số.
  5. Thêm hình ảnh bằng phương thức add().Tương tự, thêm nhiều hình ảnh hơn.
  6. Khởi tạo đối tượng lớp GettingSettings.
  7. Chỉ định các tùy chọn nhận dạng.
  8. Sau đó, gọi phương thức nhận dạng() với đối tượng OcrInput làm đối số.
  9. Cuối cùng, lưu kết quả dưới dạng tệp văn bản bằng phương thức save().

Mẫu mã sau đây cho biết cách chỉ định bộ lọc và cài đặt nhận dạng để chuyển đổi văn bản từ hình ảnh sang tệp văn bản trong Python.

# Ví dụ mã này cho thấy cách trích xuất văn bản tiếng Anh từ hình ảnh và lưu dưới dạng tệp văn bản trong Python
import aspose.ocr as ocr

# Khởi tạo API Aspose.OCR
api = ocr.AsposeOcr()

# đặt tùy chọn tiền xử lý
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())

# Thêm hình ảnh vào lô nhận dạng
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")

# Đặt tùy chọn nhận dạng
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG

# Nhận ra
result = api.recognize(img, settings)

# Kết quả nhận dạng in
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);

Thư viện Python OCR – Nhận giấy phép miễn phí

Hãy truy cập trang “Giấy phép tạm thời” của chúng tôi để tìm hiểu cách nhận giấy phép miễn phí một cách dễ dàng và mở khóa quyền truy cập không giới hạn vào thư viện Python OCR. Bắt đầu chuyển đổi văn bản từ hình ảnh sang tập tin văn bản ngay hôm nay!

Chuyển đổi văn bản hình ảnh thành văn bản – Tài nguyên miễn phí

Khám phá các tài nguyên bên dưới để khám phá thêm về các tính năng và khả năng của thư viện:

Phần kết luận

Trong bài đăng trên blog này, chúng tôi đã trình bày cách sử dụng Aspose.OCR for Python để chuyển đổi văn bản từ hình ảnh sang tệp TXT. Bằng cách làm theo các bước được nêu ở trên, bạn có thể dễ dàng tích hợp chức năng OCR vào các ứng dụng Python của mình, cho phép bạn trích xuất và xử lý văn bản từ nhiều loại hình ảnh khác nhau. Cho dù bạn đang làm việc về số hóa tài liệu, trích xuất dữ liệu hay bất kỳ tác vụ nào khác liên quan đến OCR, Aspose.OCR đều cung cấp giải pháp đáng tin cậy và hiệu quả. Chúc mừng mã hóa!

Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn hỗ trợ miễn phí của chúng tôi.

Xem thêm