Imagen a DOCX OCR C++

Las imágenes y los documentos escaneados pueden contener información textual que quizás deba procesar más. Es posible que haya capturado imágenes de documentos de texto con su teléfono inteligente que desea convertir en documentos editables. Para esto, realizar OCR en las imágenes puede resultar útil. Con OCR, puede convertir imágenes en documentos de Word editables y con capacidad de búsqueda. Con ese fin, este artículo le enseñará cómo convertir imágenes a documentos de Word usando C++.

API de C++ para convertir imágenes en documentos de Word

Aspose.OCR for C++ es una API de reconocimiento óptico de caracteres que puede extraer texto de las imágenes. La API también le permite convertir imágenes a documentos de Word como archivos DOC, DOCX y TXT. Puede instalar la API a través de NuGet o descargarla directamente desde la sección Descargas.

PM> Install-Package Aspose.OCR.Cpp

Convertir imagen a documento de Word usando C++

A menudo, es posible que necesite buscar o editar el texto de las imágenes, pero no puede hacerlo. Al realizar OCR en dichas imágenes y convertirlas en documentos de Word, puede buscar y editar el texto según sea necesario. Para lograr esto, siga los pasos que se indican a continuación.

El siguiente código de ejemplo muestra cómo convertir una imagen en un documento de Word mediante C++:

// Ruta del archivo de origen
std::string image_path = "SourceDirectory\\sample.png";

// Preparar el búfer para el resultado (en símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Establecer la configuración de reconocimiento
RecognitionSettings settings;
settings.save_format = file_format::docx;

// Realice la operación de OCR y guarde el archivo de salida.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
Captura de pantalla de la imagen de origen y el archivo de Word de salida

Captura de pantalla de la imagen de origen y el archivo de Word de salida

Convierta una imagen torcida en un documento de Word usando C++

Las imágenes y los documentos escaneados a veces pueden estar sesgados. Con Aspose.OCR for C++, puede realizar OCR en imágenes sesgadas. Los siguientes son los pasos para convertir una imagen torcida en un documento de Word:

El siguiente código de ejemplo muestra cómo convertir una imagen torcida en un documento de Word usando C++:

// Ruta del archivo de origen
std::string image_path = "SourceDirectory\\skewSample.png";

// Preparar el búfer para el resultado (en símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Calcular ángulo de inclinación
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// Establecer la configuración de reconocimiento
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;

// Realice la operación de OCR y guarde el archivo de salida.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
Captura de pantalla de la imagen de origen y el archivo de Word de salida

Captura de pantalla de la imagen de origen y el archivo de Word de salida

Obtenga una licencia gratis

Para probar la API sin limitaciones de evaluación, puede solicitar una licencia temporal gratuita.

Conclusión

En este artículo, ha aprendido cómo convertir imágenes a documentos de Word usando C++. Además, ha visto cómo calcular y utilizar el ángulo de inclinación de una imagen para realizar OCR en imágenes inclinadas. La API proporciona muchas funciones adicionales que puede explorar en detalle visitando la documentación oficial. Si tiene alguna pregunta, no dude en comunicarse con nosotros en nuestro foro de soporte gratuito.

Ver también