Изображение в PDF OCR C++

Изображения и отсканированные документы могут содержать текстовую информацию, которая может потребоваться для дальнейшей обработки. Для этого может оказаться полезным выполнение операций OCR на таких изображениях. Вы можете извлечь текст из таких изображений и сохранить его в виде доступного для поиска файла PDF. С этой целью эта статья научит вас преобразовывать изображения в PDF-файлы с возможностью поиска с помощью C++.

C++ API для преобразования изображений в PDF-файлы с возможностью поиска

Aspose.OCR for C++ — это API-интерфейс оптического распознавания символов, который может надежно выполнять операции оптического распознавания символов на изображениях и отсканированных документах. API также позволяет преобразовывать изображения в PDF-файлы с возможностью поиска. Вы можете либо установить API через NuGet, либо загрузить его напрямую из раздела Загрузки.

PM> Install-Package Aspose.OCR.Cpp

Преобразование изображения в PDF-файл с возможностью поиска с помощью C++

Aspose.OCR для C++ предоставляет возможность конвертировать изображения JPEG, BMP и PNG в PDF-файлы с возможностью поиска. Для этого выполните следующие шаги:

В следующем примере кода показано, как создать PDF-файл с возможностью поиска из изображения с помощью C++:

// Путь к исходному файлу
std::string image_path = "SourceDirectory\\sample.png";

// Подготовить буфер для результата (в символах len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Задайте настройки распознавания
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;

// Выполните операцию OCR и сохраните выходной файл.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);
Скриншот исходного изображения и выходного PDF-файла

Скриншот исходного изображения и выходного PDF-файла

Преобразование перекошенного изображения в PDF-файл с возможностью поиска с помощью C++

API также предоставляет возможность выполнять операции OCR на перекошенных изображениях. Ниже приведены шаги для преобразования перекошенного изображения в доступный для поиска файл PDF.

Ниже приведены шаги для преобразования перекошенного изображения в файл PDF с возможностью поиска с помощью C++.

// Путь к исходному файлу
std::string image_path = "SourceDirectory\\skewSample.png";

// Подготовить буфер для результата (в символах len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Вычислить угол наклона
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// Задайте настройки распознавания
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;

// Выполните операцию OCR и сохраните выходной файл.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);
Скриншот исходного изображения и выходного PDF-файла

Скриншот исходного изображения и выходного PDF-файла

Получить бесплатную лицензию

Чтобы попробовать API без ограничений на пробную версию, вы можете запросить бесплатную временную лицензию.

Вывод

В этой статье вы узнали, как конвертировать изображения в PDF-файлы с возможностью поиска с помощью C++. С помощью Aspose.OCR for C++ API вы можете конвертировать изображения JPEG, BMP и PNG в формат PDF. API предоставляет множество дополнительных функций, которые вы можете подробно изучить, посетив официальную документацию. Если у вас возникнут вопросы, свяжитесь с нами на нашем бесплатном форуме поддержки.

Смотрите также