Hình ảnh và tài liệu được quét có thể chứa thông tin dạng văn bản mà bạn có thể cần phải xử lý thêm. Vì vậy, việc thực hiện các thao tác OCR trên những hình ảnh như vậy có thể hữu ích. Bạn có thể trích xuất văn bản từ những hình ảnh như vậy và lưu nó dưới dạng tệp PDF có thể tìm kiếm được. Để đạt được mục tiêu đó, bài viết này sẽ hướng dẫn bạn cách chuyển đổi hình ảnh sang tệp PDF có thể tìm kiếm bằng C ++.
- API C ++ để chuyển đổi hình ảnh thành tệp PDF có thể tìm kiếm
- Chuyển đổi hình ảnh thành tệp PDF có thể tìm kiếm bằng C ++
- Chuyển đổi hình ảnh bị lệch thành tệp PDF có thể tìm kiếm bằng C ++
API C ++ để chuyển đổi hình ảnh thành tệp PDF có thể tìm kiếm
Aspose.OCR cho C ++ là một API nhận dạng ký tự quang học có thể thực hiện các hoạt động OCR trên hình ảnh và tài liệu được quét một cách đáng tin cậy. API cũng cho phép bạn chuyển đổi hình ảnh thành các tệp PDF có thể tìm kiếm được. Bạn có thể cài đặt API thông qua NuGet hoặc tải xuống trực tiếp từ phần Tải xuống.
PM> Install-Package Aspose.OCR.Cpp
Chuyển đổi hình ảnh thành tệp PDF có thể tìm kiếm bằng C ++
Aspose.OCR for C ++ cung cấp cho bạn khả năng chuyển đổi hình ảnh JPEG, BMP và PNG thành các tệp PDF có thể tìm kiếm được. Để đạt được điều này, vui lòng làm theo các bước dưới đây:
- Chuẩn bị bộ đệm cho kết quả.
- Đặt giá trị của thành viên struct RecognitionSettings.saveformat dưới dạng fileformat :: pdf.
- Thực hiện thao tác OCR trên hình ảnh và lưu tệp PDF bằng phương pháp asposeocrpagesave (const char \ imagepath, const char \ savepath, cài đặt RecognitionSettings).
Mã mẫu sau đây cho thấy cách tạo tệp PDF có thể tìm kiếm từ một hình ảnh bằng C ++:
// Đường dẫn tệp nguồn
std::string image_path = "SourceDirectory\\sample.png";
// Chuẩn bị bộ đệm cho kết quả (theo ký hiệu, len_byte = len * sizeof (wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Đặt cài đặt nhận dạng
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
// Thực hiện thao tác OCR và lưu tệp đầu ra.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);
Chuyển đổi hình ảnh bị lệch thành tệp PDF có thể tìm kiếm bằng C ++
API cũng cung cấp khả năng thực hiện các hoạt động OCR trên các hình ảnh bị lệch. Sau đây là các bước để chuyển đổi hình ảnh bị lệch thành tệp PDF có thể tìm kiếm:
- Chuẩn bị bộ đệm cho kết quả.
- Tính toán góc xiên của hình ảnh bằng phương pháp asposeocrgetskew (const char \ imagepath).
- Đặt giá trị của thành viên struct RecognitionSettings.saveformat dưới dạng fileformat :: pdf.
- Chỉ định góc xiên bằng thành viên cấu trúc RecognitionSettings.skew.
- Thực hiện thao tác OCR trên hình ảnh và lưu tệp PDF bằng phương pháp asposeocrpagesave (const char \ imagepath, const char \ savepath, cài đặt RecognitionSettings).
Sau đây là các bước để chuyển đổi hình ảnh bị lệch thành tệp PDF có thể tìm kiếm bằng C ++:
// Đường dẫn tệp nguồn
std::string image_path = "SourceDirectory\\skewSample.png";
// Chuẩn bị bộ đệm cho kết quả (theo ký hiệu, len_byte = len * sizeof (wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Tính góc xiên
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// Đặt cài đặt nhận dạng
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;
// Thực hiện thao tác OCR và lưu tệp đầu ra.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);
Nhận giấy phép miễn phí
Để dùng thử API mà không có giới hạn đánh giá, bạn có thể yêu cầu giấy phép tạm thời miễn phí.
Sự kết luận
Trong bài viết này, bạn đã học cách chuyển đổi hình ảnh sang tệp PDF có thể tìm kiếm bằng C ++. Với API Aspose.OCR cho C ++, bạn có thể chuyển đổi hình ảnh JPEG, BMP và PNG sang định dạng PDF. API cung cấp nhiều tính năng bổ sung mà bạn có thể khám phá chi tiết bằng cách truy cập tài liệu chính thức. Trong trường hợp có bất kỳ câu hỏi nào, vui lòng liên hệ với chúng tôi trên diễn đàn hỗ trợ miễn phí của chúng tôi.