Les images et les documents numérisés peuvent contenir des informations textuelles que vous devrez peut-être traiter ultérieurement. Vous avez peut-être capturé des images de documents texte à l’aide de votre smartphone que vous souhaitez convertir en documents modifiables. Pour cela, effectuer un OCR sur les images peut s’avérer utile. Avec OCR, vous pouvez convertir des images en documents Word interrogeables et modifiables. À cette fin, cet article vous apprendra comment convertir des images en documents Word à l’aide de C++.
- API C++ pour convertir des images en documents Word
- Convertir une image en document Word à l’aide de C++
- Convertir une image asymétrique en document Word à l’aide de C++
API C++ pour convertir des images en documents Word
Aspose.OCR for C++ est une API de reconnaissance optique de caractères capable d’extraire du texte à partir d’images. L’API vous permet également de convertir des images en documents Word tels que les fichiers DOC, DOCX et TXT. Vous pouvez soit installer l’API via NuGet ou la télécharger directement à partir de la section Téléchargements.
PM> Install-Package Aspose.OCR.Cpp
Convertir une image en document Word à l’aide de C++
Souvent, vous devrez peut-être rechercher ou modifier le texte des images, mais vous ne pourrez pas le faire. En exécutant l’OCR sur ces images et en les convertissant en documents Word, vous pouvez rechercher et modifier le texte selon vos besoins. Pour y parvenir, veuillez suivre les étapes ci-dessous.
- Préparez le tampon pour le résultat.
- Définissez la valeur du membre de la structure RecognitionSettings.saveformat sur fileformat::docx.
- Effectuez l’opération OCR sur l’image et enregistrez le fichier Word à l’aide de la méthode asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).
L’exemple de code suivant montre comment convertir une image en document Word à l’aide de C++ :
// Chemin du fichier source
std::string image_path = "SourceDirectory\\sample.png";
// Préparer le tampon pour le résultat (en symboles, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Définir les paramètres de reconnaissance
RecognitionSettings settings;
settings.save_format = file_format::docx;
// Effectuez l'opération OCR et enregistrez le fichier de sortie.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
Convertir une image asymétrique en document Word à l’aide de C++
Les images et les documents numérisés peuvent parfois être faussés. Avec Aspose.OCR for C++, vous pouvez effectuer l’OCR sur des images asymétriques. Voici les étapes pour convertir une image inclinée en un document Word :
- Préparez le tampon pour le résultat.
- Calculez l’angle d’inclinaison de l’image à l’aide de la méthode asposeocrgetskew(const char \ imagepath).
- Définissez la valeur du membre de la structure RecognitionSettings.saveformat sur fileformat::docx.
- Spécifiez l’angle d’inclinaison à l’aide du membre de structure RecognitionSettings.skew.
- Effectuez l’opération OCR sur l’image et enregistrez le fichier Word à l’aide de la méthode asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).
L’exemple de code suivant montre comment convertir une image inclinée en un document Word à l’aide de C++ :
// Chemin du fichier source
std::string image_path = "SourceDirectory\\skewSample.png";
// Préparer le tampon pour le résultat (en symboles, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Calculer l'angle d'inclinaison
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// Définir les paramètres de reconnaissance
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;
// Effectuez l'opération OCR et enregistrez le fichier de sortie.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
Obtenez une licence gratuite
Afin d’essayer l’API sans limitation d’évaluation, vous pouvez demander une licence temporaire gratuite.
Conclusion
Dans cet article, vous avez appris à convertir des images en documents Word à l’aide de C++. De plus, vous avez vu comment calculer et utiliser l’angle d’inclinaison d’une image pour effectuer l’OCR sur des images asymétriques. L’API fournit de nombreuses fonctionnalités supplémentaires que vous pouvez explorer en détail en visitant la documentation officielle. En cas de questions, n’hésitez pas à nous contacter sur notre forum d’assistance gratuit.