Hình ảnh sang DOCX OCR C ++

Hình ảnh và tài liệu được quét có thể chứa thông tin dạng văn bản mà bạn có thể cần phải xử lý thêm. Bạn có thể đã chụp ảnh tài liệu văn bản bằng điện thoại thông minh mà bạn muốn chuyển đổi thành tài liệu có thể chỉnh sửa. Đối với điều này, thực hiện OCR trên các hình ảnh có thể tỏ ra hữu ích. Với OCR, bạn có thể chuyển đổi hình ảnh sang tài liệu Word có thể tìm kiếm và chỉnh sửa được. Để kết thúc, bài viết này sẽ hướng dẫn bạn cách chuyển đổi hình ảnh sang tài liệu Word bằng C ++.

API C ++ để chuyển đổi hình ảnh sang tài liệu Word

Aspose.OCR cho C ++ là một API nhận dạng ký tự quang học có thể trích xuất văn bản từ hình ảnh. API cũng cho phép bạn chuyển đổi hình ảnh sang các tài liệu Word như tệp DOC, DOCXTXT. Bạn có thể cài đặt API thông qua NuGet hoặc tải xuống trực tiếp từ phần Tải xuống.

PM> Install-Package Aspose.OCR.Cpp

Chuyển đổi hình ảnh sang tài liệu Word bằng C ++

Thông thường, bạn có thể cần tìm kiếm hoặc chỉnh sửa văn bản trong hình ảnh, nhưng bạn không thể làm như vậy. Bằng cách thực hiện OCR trên những hình ảnh đó và chuyển đổi chúng sang tài liệu Word, bạn có thể tìm kiếm và chỉnh sửa văn bản nếu cần. Để đạt được điều này, vui lòng làm theo các bước dưới đây.

Đoạn mã mẫu sau đây cho thấy cách chuyển đổi hình ảnh sang tài liệu Word bằng C ++:

// Đường dẫn tệp nguồn
std::string image_path = "SourceDirectory\\sample.png";

// Chuẩn bị bộ đệm cho kết quả (theo ký hiệu, len_byte = len * sizeof (wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Đặt cài đặt nhận dạng
RecognitionSettings settings;
settings.save_format = file_format::docx;

// Thực hiện thao tác OCR và lưu tệp đầu ra.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
Ảnh chụp màn hình của hình ảnh nguồn và tệp Word xuất ra

Ảnh chụp màn hình của hình ảnh nguồn và tệp Word xuất ra

Chuyển đổi hình ảnh bị lệch sang tài liệu Word bằng C ++

Hình ảnh và tài liệu được quét đôi khi có thể bị lệch. Với API Aspose.OCR cho C ++, bạn có thể thực hiện OCR trên các hình ảnh bị lệch. Sau đây là các bước để chuyển đổi hình ảnh bị lệch sang tài liệu Word:

Mã mẫu sau đây cho thấy cách chuyển đổi hình ảnh bị lệch sang tài liệu Word bằng C ++:

// Đường dẫn tệp nguồn
std::string image_path = "SourceDirectory\\skewSample.png";

// Chuẩn bị bộ đệm cho kết quả (theo ký hiệu, len_byte = len * sizeof (wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Tính góc xiên
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// Đặt cài đặt nhận dạng
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;

// Thực hiện thao tác OCR và lưu tệp đầu ra.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
Ảnh chụp màn hình của hình ảnh nguồn và tệp Word xuất ra

Ảnh chụp màn hình của hình ảnh nguồn và tệp Word xuất ra

Nhận giấy phép miễn phí

Để dùng thử API mà không có giới hạn đánh giá, bạn có thể yêu cầu giấy phép tạm thời miễn phí.

Sự kết luận

Trong bài viết này, bạn đã biết cách chuyển đổi hình ảnh sang tài liệu Word bằng C ++. Hơn nữa, bạn đã thấy cách tính toán và sử dụng góc xiên của hình ảnh để thực hiện OCR trên hình ảnh bị lệch. API cung cấp nhiều tính năng bổ sung mà bạn có thể khám phá chi tiết bằng cách truy cập tài liệu chính thức. Trong trường hợp có bất kỳ câu hỏi nào, vui lòng liên hệ với chúng tôi trên diễn đàn hỗ trợ miễn phí của chúng tôi.

Xem thêm