Las imágenes y los documentos escaneados pueden contener información textual que quizás deba procesar más. Es posible que haya capturado imágenes de documentos de texto con su teléfono inteligente que desea convertir en documentos editables. Para esto, realizar OCR en las imágenes puede resultar útil. Con OCR, puede convertir imágenes en documentos de Word editables y con capacidad de búsqueda. Con ese fin, este artículo le enseñará cómo convertir imágenes a documentos de Word usando C++.
- API de C++ para convertir imágenes en documentos de Word
- Convertir imagen a documento de Word usando C++
- Convierta una imagen torcida en un documento de Word usando C++
API de C++ para convertir imágenes en documentos de Word
Aspose.OCR for C++ es una API de reconocimiento óptico de caracteres que puede extraer texto de las imágenes. La API también le permite convertir imágenes a documentos de Word como archivos DOC, DOCX y TXT. Puede instalar la API a través de NuGet o descargarla directamente desde la sección Descargas.
PM> Install-Package Aspose.OCR.Cpp
Convertir imagen a documento de Word usando C++
A menudo, es posible que necesite buscar o editar el texto de las imágenes, pero no puede hacerlo. Al realizar OCR en dichas imágenes y convertirlas en documentos de Word, puede buscar y editar el texto según sea necesario. Para lograr esto, siga los pasos que se indican a continuación.
- Prepare el búfer para el resultado.
- Establezca el valor del miembro de estructura RecognitionSettings.save\format como file\format::docx.
- Realice la operación de OCR en la imagen y guarde el archivo de Word usando el método asposeocr\page\save(const char \ image\path, const char \ save\path, RecognitionSettings settings).
El siguiente código de ejemplo muestra cómo convertir una imagen en un documento de Word mediante C++:
// Ruta del archivo de origen
std::string image_path = "SourceDirectory\\sample.png";
// Preparar el búfer para el resultado (en símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Establecer la configuración de reconocimiento
RecognitionSettings settings;
settings.save_format = file_format::docx;
// Realice la operación de OCR y guarde el archivo de salida.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
Convierta una imagen torcida en un documento de Word usando C++
Las imágenes y los documentos escaneados a veces pueden estar sesgados. Con Aspose.OCR for C++, puede realizar OCR en imágenes sesgadas. Los siguientes son los pasos para convertir una imagen torcida en un documento de Word:
- Prepare el búfer para el resultado.
- Calcule el ángulo de inclinación de la imagen usando el método asposeocr\get_skew(const char \ image\path).
- Establezca el valor de RecognitionSettings.save\format struct miembro como file\format::docx.
- Especifique el ángulo de inclinación utilizando el miembro de estructura RecognitionSettings.skew.
- Realice la operación de OCR en la imagen y guarde el archivo de Word usando el método asposeocr\page\save(const char \ image\path, const char \ save\path, RecognitionSettings settings).
El siguiente código de ejemplo muestra cómo convertir una imagen torcida en un documento de Word usando C++:
// Ruta del archivo de origen
std::string image_path = "SourceDirectory\\skewSample.png";
// Preparar el búfer para el resultado (en símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Calcular ángulo de inclinación
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// Establecer la configuración de reconocimiento
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;
// Realice la operación de OCR y guarde el archivo de salida.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
Obtenga una licencia gratis
Para probar la API sin limitaciones de evaluación, puede solicitar una licencia temporal gratuita.
Conclusión
En este artículo, ha aprendido cómo convertir imágenes a documentos de Word usando C++. Además, ha visto cómo calcular y utilizar el ángulo de inclinación de una imagen para realizar OCR en imágenes inclinadas. La API proporciona muchas funciones adicionales que puede explorar en detalle visitando la documentación oficial. Si tiene alguna pregunta, no dude en comunicarse con nosotros en nuestro foro de soporte gratuito.