Изображения и отсканированные документы могут содержать текстовую информацию, которая может потребоваться для дальнейшей обработки. Для этого может оказаться полезным выполнение операций OCR на таких изображениях. Вы можете извлечь текст из таких изображений и сохранить его в виде доступного для поиска файла PDF. С этой целью эта статья научит вас преобразовывать изображения в PDF-файлы с возможностью поиска с помощью C++.
- C++ API для преобразования изображений в PDF-файлы с возможностью поиска
- Преобразование изображения в PDF-файл с возможностью поиска с помощью C++
- Преобразование перекошенного изображения в PDF-файл с возможностью поиска с помощью C++
C++ API для преобразования изображений в PDF-файлы с возможностью поиска
Aspose.OCR for C++ — это API-интерфейс оптического распознавания символов, который может надежно выполнять операции оптического распознавания символов на изображениях и отсканированных документах. API также позволяет преобразовывать изображения в PDF-файлы с возможностью поиска. Вы можете либо установить API через NuGet, либо загрузить его напрямую из раздела Загрузки.
PM> Install-Package Aspose.OCR.Cpp
Преобразование изображения в PDF-файл с возможностью поиска с помощью C++
Aspose.OCR для C++ предоставляет возможность конвертировать изображения JPEG, BMP и PNG в PDF-файлы с возможностью поиска. Для этого выполните следующие шаги:
- Подготовьте буфер для результата.
- Задайте значение члена структуры RecognitionSettings.save\format как файл\формат::pdf.
- Выполните операцию OCR на изображении и сохраните файл PDF, используя метод asposeocr\page\save(const char \ image\path, const char \ save\path, настройки RecognitionSettings).
В следующем примере кода показано, как создать PDF-файл с возможностью поиска из изображения с помощью C++:
// Путь к исходному файлу
std::string image_path = "SourceDirectory\\sample.png";
// Подготовить буфер для результата (в символах len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Задайте настройки распознавания
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
// Выполните операцию OCR и сохраните выходной файл.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);
Преобразование перекошенного изображения в PDF-файл с возможностью поиска с помощью C++
API также предоставляет возможность выполнять операции OCR на перекошенных изображениях. Ниже приведены шаги для преобразования перекошенного изображения в доступный для поиска файл PDF.
- Подготовьте буфер для результата.
- Вычислите угол наклона изображения с помощью метода asposeocr\get_skew(const char \ image\path).
- Задайте значение члена структуры RecognitionSettings.save\format как файл\формат::pdf.
- Укажите угол наклона с помощью члена структуры RecognitionSettings.skew.
- Выполните операцию OCR на изображении и сохраните файл PDF с помощью метода asposeocr\page\save(const char \ image\path, const char \ save\path, настройки RecognitionSettings).
Ниже приведены шаги для преобразования перекошенного изображения в файл PDF с возможностью поиска с помощью C++.
// Путь к исходному файлу
std::string image_path = "SourceDirectory\\skewSample.png";
// Подготовить буфер для результата (в символах len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Вычислить угол наклона
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// Задайте настройки распознавания
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;
// Выполните операцию OCR и сохраните выходной файл.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);
Получить бесплатную лицензию
Чтобы попробовать API без ограничений на пробную версию, вы можете запросить бесплатную временную лицензию.
Вывод
В этой статье вы узнали, как конвертировать изображения в PDF-файлы с возможностью поиска с помощью C++. С помощью Aspose.OCR for C++ API вы можете конвертировать изображения JPEG, BMP и PNG в формат PDF. API предоставляет множество дополнительных функций, которые вы можете подробно изучить, посетив официальную документацию. Если у вас возникнут вопросы, свяжитесь с нами на нашем бесплатном форуме поддержки.