Image vers DOCX OCR C++

Les images et les documents numérisés peuvent contenir des informations textuelles que vous devrez peut-être traiter ultérieurement. Vous avez peut-être capturé des images de documents texte à l’aide de votre smartphone que vous souhaitez convertir en documents modifiables. Pour cela, effectuer un OCR sur les images peut s’avérer utile. Avec OCR, vous pouvez convertir des images en documents Word interrogeables et modifiables. À cette fin, cet article vous apprendra comment convertir des images en documents Word à l’aide de C++.

API C++ pour convertir des images en documents Word

Aspose.OCR for C++ est une API de reconnaissance optique de caractères capable d’extraire du texte à partir d’images. L’API vous permet également de convertir des images en documents Word tels que les fichiers DOC, DOCX et TXT. Vous pouvez soit installer l’API via NuGet ou la télécharger directement à partir de la section Téléchargements.

PM> Install-Package Aspose.OCR.Cpp

Convertir une image en document Word à l’aide de C++

Souvent, vous devrez peut-être rechercher ou modifier le texte des images, mais vous ne pourrez pas le faire. En exécutant l’OCR sur ces images et en les convertissant en documents Word, vous pouvez rechercher et modifier le texte selon vos besoins. Pour y parvenir, veuillez suivre les étapes ci-dessous.

L’exemple de code suivant montre comment convertir une image en document Word à l’aide de C++ :

// Chemin du fichier source
std::string image_path = "SourceDirectory\\sample.png";

// Préparer le tampon pour le résultat (en symboles, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Définir les paramètres de reconnaissance
RecognitionSettings settings;
settings.save_format = file_format::docx;

// Effectuez l'opération OCR et enregistrez le fichier de sortie.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
Capture d'écran de l'image source et du fichier Word de sortie

Capture d’écran de l’image source et du fichier Word de sortie

Convertir une image asymétrique en document Word à l’aide de C++

Les images et les documents numérisés peuvent parfois être faussés. Avec Aspose.OCR for C++, vous pouvez effectuer l’OCR sur des images asymétriques. Voici les étapes pour convertir une image inclinée en un document Word :

L’exemple de code suivant montre comment convertir une image inclinée en un document Word à l’aide de C++ :

// Chemin du fichier source
std::string image_path = "SourceDirectory\\skewSample.png";

// Préparer le tampon pour le résultat (en symboles, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Calculer l'angle d'inclinaison
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// Définir les paramètres de reconnaissance
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;

// Effectuez l'opération OCR et enregistrez le fichier de sortie.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
Capture d'écran de l'image source et du fichier Word de sortie

Capture d’écran de l’image source et du fichier Word de sortie

Obtenez une licence gratuite

Afin d’essayer l’API sans limitation d’évaluation, vous pouvez demander une licence temporaire gratuite.

Conclusion

Dans cet article, vous avez appris à convertir des images en documents Word à l’aide de C++. De plus, vous avez vu comment calculer et utiliser l’angle d’inclinaison d’une image pour effectuer l’OCR sur des images asymétriques. L’API fournit de nombreuses fonctionnalités supplémentaires que vous pouvez explorer en détail en visitant la documentation officielle. En cas de questions, n’hésitez pas à nous contacter sur notre forum d’assistance gratuit.

Voir également