Effectuer l'OCR en utilisant C#

L’OCR (Optical Character Recognition) est une technologie bien connue et largement utilisée pour reconnaître et lire du texte à partir d’images et de documents numérisés. Dans l’opération OCR, les caractères des images sont numérisés, reconnus et convertis au format numérique. Le texte converti peut être validé et enregistré pour effectuer d’autres opérations. Dans cet article, je vais vous montrer comment effectuer l’OCR pour convertir des images en texte par programme à l’aide de la bibliothèque C# .NET OCR. Le reste de l’article est divisé dans les sections suivantes.

Bibliothèque C# OCR - Téléchargement gratuit

Aspose.OCR for .NET est une bibliothèque OCR puissante et rapide pour C# qui vous permet de numériser et de convertir assez facilement des images en texte. Il ne nécessite pas de longs codes pour que les fonctionnalités OCR soient opérationnelles dans vos applications .NET. Voici les méthodes d’installation de la bibliothèque C# OCR.

Installer la bibliothèque C# .NET OCR via le gestionnaire de packages NuGet

Recherchez simplement Aspose.OCR dans NuGet Package Manager et installez-le.

Bibliothèque OCR C#

Installer la bibliothèque C# OCR via la console du gestionnaire de packages

Voici la commande pour installer Aspose.OCR via la console du gestionnaire de packages.

PM> Install-Package Aspose.OCR

Convertir une image en texte à l’aide de la bibliothèque C# OCR

Voyons comment effectuer l’OCR sur une image qui pourrait éventuellement être une page d’un document numérisé. Voici les étapes pour effectuer cette opération.

L’exemple de code suivant montre comment convertir une image en texte à l’aide de C#.

// Pour des exemples complets et des fichiers de données, rendez-vous sur https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Chemin d'accès au répertoire des documents.
string dataDir = RunExamples.GetDataDir_OCR();

// Initialiser une instance de AsposeOcr
AsposeOcr api = new AsposeOcr();

// Reconnaître l'image
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");

// Afficher le texte reconnu
Console.WriteLine(result);

C# Effectuer l’OCR sur une image avec une seule ligne de texte

Dans l’exemple précédent, nous avons effectué l’OCR sur l’image qui contenait plusieurs lignes de texte. Cependant, il est possible que l’image ne contienne qu’une seule ligne de texte. Dans de tels cas, vous pouvez demander à l’API de ne reconnaître que la ligne. Voici les étapes pour effectuer la conversion d’une image contenant une seule ligne de texte en C#.

L’exemple de code suivant montre comment effectuer l’OCR et convertir une image contenant une seule ligne de texte à l’aide de C#.

// Pour des exemples complets et des fichiers de données, rendez-vous sur https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Chemin d'accès au répertoire des documents.
string dataDir = RunExamples.GetDataDir_OCR();

// Initialiser une instance de AsposeOcr
AsposeOcr api = new AsposeOcr();

// Reconnaître l'image
string result = api.RecognizeLine(dataDir + "sample_line.png");

// Afficher le texte reconnu
Console.WriteLine(result);

Effectuer l’OCR pour les caractères non anglais

Aspose.OCR ne limite pas les fonctionnalités OCR pour la langue anglaise et vous pouvez également reconnaître les caractères d’autres langues. Le processus de reconnaissance et le code resteront les mêmes quelle que soit la langue du texte. Voici le jeu de caractères pouvant être reconnus par la bibliothèque C# OCR d’Aspose.

OCR pour les caractères non anglais

Bibliothèque C# OCR - Obtenez une licence gratuite

Vous pouvez utiliser Aspose.OCR sans limitation d’évaluation en demandant une [licence temporaire gratuite][7].

Conclusion

Cet article a montré comment effectuer l’OCR et convertir des images en texte par programmation en C#. Vous pouvez reconnaître les caractères des images contenant une ou plusieurs lignes de texte. En savoir plus sur la bibliothèque C# OCR dans la documentation.

Voir également