Imagen a PDF OCR C++

Las imágenes y los documentos escaneados pueden contener información textual que quizás deba procesar más. Para ello, puede resultar útil realizar operaciones de OCR en dichas imágenes. Puede extraer texto de dichas imágenes y guardarlo como un archivo PDF con capacidad de búsqueda. Con ese fin, este artículo le enseñará cómo convertir imágenes en archivos PDF con capacidad de búsqueda usando C++.

API de C++ para convertir imágenes en archivos PDF con capacidad de búsqueda

Aspose.OCR for C++ es una API de reconocimiento óptico de caracteres que puede realizar operaciones de OCR de manera confiable en imágenes y documentos escaneados. La API también le permite convertir imágenes en archivos PDF con capacidad de búsqueda. Puede instalar la API a través de NuGet o descargarla directamente desde la sección Descargas.

PM> Install-Package Aspose.OCR.Cpp

Convierta la imagen en un archivo PDF con capacidad de búsqueda usando C++

Aspose.OCR for C++ le ofrece la posibilidad de convertir imágenes JPEG, BMP y PNG en archivos PDF con capacidad de búsqueda. Para lograr esto, siga los pasos que se detallan a continuación:

El siguiente código de muestra muestra cómo crear un archivo PDF con capacidad de búsqueda a partir de una imagen usando C++:

// Ruta del archivo de origen
std::string image_path = "SourceDirectory\\sample.png";

// Preparar el búfer para el resultado (en símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Establecer la configuración de reconocimiento
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;

// Realice la operación de OCR y guarde el archivo de salida.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);
Captura de pantalla de la imagen de origen y el archivo PDF de salida

Captura de pantalla de la imagen de origen y el archivo PDF de salida

Convierta una imagen torcida en un archivo PDF con capacidad de búsqueda usando C++

La API también brinda la capacidad de realizar operaciones de OCR en imágenes sesgadas. Los siguientes son los pasos para convertir una imagen sesgada en un archivo PDF con capacidad de búsqueda:

Los siguientes son los pasos para convertir una imagen sesgada en un archivo PDF con capacidad de búsqueda usando C++:

// Ruta del archivo de origen
std::string image_path = "SourceDirectory\\skewSample.png";

// Preparar el búfer para el resultado (en símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Calcular ángulo de inclinación
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// Establecer la configuración de reconocimiento
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;

// Realice la operación de OCR y guarde el archivo de salida.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);
Captura de pantalla de la imagen de origen y el archivo PDF de salida

Captura de pantalla de la imagen de origen y el archivo PDF de salida

Obtenga una licencia gratis

Para probar la API sin limitaciones de evaluación, puede solicitar una licencia temporal gratuita.

Conclusión

En este artículo, aprendió a convertir imágenes en archivos PDF con capacidad de búsqueda usando C++. Con Aspose.OCR for C++, puede convertir imágenes JPEG, BMP y PNG a formato PDF. La API proporciona muchas características adicionales que puede explorar en detalle visitando la documentación oficial. Si tiene alguna pregunta, no dude en comunicarse con nosotros en nuestro foro de soporte gratuito.

Ver también