Hình ảnh và tài liệu được quét có thể chứa thông tin dạng văn bản mà bạn có thể cần phải xử lý thêm. Bạn có thể đã chụp ảnh tài liệu văn bản bằng điện thoại thông minh mà bạn muốn chuyển đổi thành tài liệu có thể chỉnh sửa. Đối với điều này, thực hiện OCR trên các hình ảnh có thể tỏ ra hữu ích. Với OCR, bạn có thể chuyển đổi hình ảnh sang tài liệu Word có thể tìm kiếm và chỉnh sửa được. Để kết thúc, bài viết này sẽ hướng dẫn bạn cách chuyển đổi hình ảnh sang tài liệu Word bằng C ++.
- API C ++ để chuyển đổi hình ảnh sang tài liệu Word
- Chuyển đổi hình ảnh sang tài liệu Word bằng C ++
- Chuyển đổi hình ảnh bị lệch sang tài liệu Word bằng C ++
API C ++ để chuyển đổi hình ảnh sang tài liệu Word
Aspose.OCR cho C ++ là một API nhận dạng ký tự quang học có thể trích xuất văn bản từ hình ảnh. API cũng cho phép bạn chuyển đổi hình ảnh sang các tài liệu Word như tệp DOC, DOCX và TXT. Bạn có thể cài đặt API thông qua NuGet hoặc tải xuống trực tiếp từ phần Tải xuống.
PM> Install-Package Aspose.OCR.Cpp
Chuyển đổi hình ảnh sang tài liệu Word bằng C ++
Thông thường, bạn có thể cần tìm kiếm hoặc chỉnh sửa văn bản trong hình ảnh, nhưng bạn không thể làm như vậy. Bằng cách thực hiện OCR trên những hình ảnh đó và chuyển đổi chúng sang tài liệu Word, bạn có thể tìm kiếm và chỉnh sửa văn bản nếu cần. Để đạt được điều này, vui lòng làm theo các bước dưới đây.
- Chuẩn bị bộ đệm cho kết quả.
- Đặt giá trị của thành viên struct RecognitionSettings.saveformat dưới dạng fileformat :: docx.
- Thực hiện thao tác OCR trên hình ảnh và lưu tệp Word bằng phương pháp asposeocrpagesave (const char \ imagepath, const char \ savepath, cài đặt RecognitionSettings).
Đoạn mã mẫu sau đây cho thấy cách chuyển đổi hình ảnh sang tài liệu Word bằng C ++:
// Đường dẫn tệp nguồn
std::string image_path = "SourceDirectory\\sample.png";
// Chuẩn bị bộ đệm cho kết quả (theo ký hiệu, len_byte = len * sizeof (wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Đặt cài đặt nhận dạng
RecognitionSettings settings;
settings.save_format = file_format::docx;
// Thực hiện thao tác OCR và lưu tệp đầu ra.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
Chuyển đổi hình ảnh bị lệch sang tài liệu Word bằng C ++
Hình ảnh và tài liệu được quét đôi khi có thể bị lệch. Với API Aspose.OCR cho C ++, bạn có thể thực hiện OCR trên các hình ảnh bị lệch. Sau đây là các bước để chuyển đổi hình ảnh bị lệch sang tài liệu Word:
- Chuẩn bị bộ đệm cho kết quả.
- Tính toán góc xiên của hình ảnh bằng phương pháp asposeocrgetskew (const char \ imagepath).
- Đặt giá trị của thành viên struct RecognitionSettings.saveformat dưới dạng fileformat :: docx.
- Chỉ định góc xiên bằng thành viên cấu trúc RecognitionSettings.skew.
- Thực hiện thao tác OCR trên hình ảnh và lưu tệp Word bằng phương pháp asposeocrpagesave (const char \ imagepath, const char \ savepath, cài đặt RecognitionSettings).
Mã mẫu sau đây cho thấy cách chuyển đổi hình ảnh bị lệch sang tài liệu Word bằng C ++:
// Đường dẫn tệp nguồn
std::string image_path = "SourceDirectory\\skewSample.png";
// Chuẩn bị bộ đệm cho kết quả (theo ký hiệu, len_byte = len * sizeof (wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Tính góc xiên
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// Đặt cài đặt nhận dạng
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;
// Thực hiện thao tác OCR và lưu tệp đầu ra.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
Nhận giấy phép miễn phí
Để dùng thử API mà không có giới hạn đánh giá, bạn có thể yêu cầu giấy phép tạm thời miễn phí.
Sự kết luận
Trong bài viết này, bạn đã biết cách chuyển đổi hình ảnh sang tài liệu Word bằng C ++. Hơn nữa, bạn đã thấy cách tính toán và sử dụng góc xiên của hình ảnh để thực hiện OCR trên hình ảnh bị lệch. API cung cấp nhiều tính năng bổ sung mà bạn có thể khám phá chi tiết bằng cách truy cập tài liệu chính thức. Trong trường hợp có bất kỳ câu hỏi nào, vui lòng liên hệ với chúng tôi trên diễn đàn hỗ trợ miễn phí của chúng tôi.