C++ Convertir imagen a archivo PDF con capacidad de búsqueda con OCR

Las imágenes y los documentos escaneados pueden contener información textual que quizás deba procesar más. Para ello, puede resultar útil realizar operaciones de OCR en dichas imágenes. Puede extraer texto de dichas imágenes y guardarlo como un archivo PDF con capacidad de búsqueda. Con ese fin, este artículo le enseñará cómo convertir imágenes en archivos PDF con capacidad de búsqueda usando C++.

API de C++ para convertir imágenes en archivos PDF con capacidad de búsqueda
Convierta la imagen en un archivo PDF con capacidad de búsqueda usando C++
Convierta una imagen torcida en un archivo PDF con capacidad de búsqueda usando C++

API de C++ para convertir imágenes en archivos PDF con capacidad de búsqueda

Aspose.OCR for C++ es una API de reconocimiento óptico de caracteres que puede realizar operaciones de OCR de manera confiable en imágenes y documentos escaneados. La API también le permite convertir imágenes en archivos PDF con capacidad de búsqueda. Puede instalar la API a través de NuGet o descargarla directamente desde la sección Descargas.

PM> Install-Package Aspose.OCR.Cpp

Convierta la imagen en un archivo PDF con capacidad de búsqueda usando C++

Aspose.OCR for C++ le ofrece la posibilidad de convertir imágenes JPEG, BMP y PNG en archivos PDF con capacidad de búsqueda. Para lograr esto, siga los pasos que se detallan a continuación:

Prepare el búfer para el resultado.
Establezca el valor del miembro de estructura RecognitionSettings.save\format como file\format::pdf.
Realice la operación de OCR en la imagen y guarde el archivo PDF usando el método asposeocr\page\save(const char \ image\path, const char \ save\path, RecognitionSettings settings).

El siguiente código de muestra muestra cómo crear un archivo PDF con capacidad de búsqueda a partir de una imagen usando C++:

// Ruta del archivo de origen
std::string image_path = "SourceDirectory\\sample.png";

// Preparar el búfer para el resultado (en símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Establecer la configuración de reconocimiento
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;

// Realice la operación de OCR y guarde el archivo de salida.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);

Captura de pantalla de la imagen de origen y el archivo PDF de salida

Convierta una imagen torcida en un archivo PDF con capacidad de búsqueda usando C++

La API también brinda la capacidad de realizar operaciones de OCR en imágenes sesgadas. Los siguientes son los pasos para convertir una imagen sesgada en un archivo PDF con capacidad de búsqueda:

Prepare el búfer para el resultado.
Calcule el ángulo de inclinación de la imagen utilizando el método asposeocr\get_skew(const char \ image\path).
Establezca el valor del miembro de estructura RecognitionSettings.save\format como file\format::pdf.
Especifique el ángulo de inclinación mediante el miembro de estructura RecognitionSettings.skew.
Realice la operación de OCR en la imagen y guarde el archivo PDF usando el método asposeocr\page\save(const char \ image\path, const char \ save\path, RecognitionSettings settings).

Los siguientes son los pasos para convertir una imagen sesgada en un archivo PDF con capacidad de búsqueda usando C++:

// Ruta del archivo de origen
std::string image_path = "SourceDirectory\\skewSample.png";

// Preparar el búfer para el resultado (en símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Calcular ángulo de inclinación
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// Establecer la configuración de reconocimiento
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;

// Realice la operación de OCR y guarde el archivo de salida.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);

Obtenga una licencia gratis

Para probar la API sin limitaciones de evaluación, puede solicitar una licencia temporal gratuita.

Conclusión

En este artículo, aprendió a convertir imágenes en archivos PDF con capacidad de búsqueda usando C++. Con Aspose.OCR for C++, puede convertir imágenes JPEG, BMP y PNG a formato PDF. La API proporciona muchas características adicionales que puede explorar en detalle visitando la documentación oficial. Si tiene alguna pregunta, no dude en comunicarse con nosotros en nuestro foro de soporte gratuito.

Ver también

Inserte o elimine marcas de agua de texto/imagen en archivos PDF usando C++

API de C++ para convertir imágenes en archivos PDF con capacidad de búsqueda#

Convierta la imagen en un archivo PDF con capacidad de búsqueda usando C++#

Convierta una imagen torcida en un archivo PDF con capacidad de búsqueda usando C++#

Obtenga una licencia gratis#

Conclusión#

Ver también#