Image OCR en texte et correction orthographique en C #

Nous pouvons effectuer l’OCR sur des images ou des documents numérisés et extraire des données textuelles par programmation à l’aide de C#. Nous pouvons ensuite exécuter un correcteur orthographique pour corriger les fautes d’orthographe dans le texte reconnu. Dans cet article, nous apprendrons comment effectuer une image OCR en texte et une correction orthographique en C#.

Les sujets suivants seront traités dans cet article :

  1. API C# de correction d’image OCR en texte et orthographe
  2. Image OCR en texte et correction des fautes d’orthographe
  3. Convertir l’image en texte avec correction orthographique
  4. Enregistrer le texte reconnu avec l’orthographe corrigée
  5. Texte personnalisé de vérification orthographique

Image OCR en texte et correction orthographique API C#

Nous utiliserons l’API Aspose.OCR pour .NET pour effectuer l’OCR sur les images, l’extraction de texte et la correction orthographique. Il peut reconnaître les images numérisées, les photos de smartphone, les captures d’écran, les zones d’images et les PDF numérisés. Il renvoie des résultats de texte reconnus dans les formats d’échange de documents et de données les plus populaires. L’API permet également de convertir des images en texte et de créer des PDF consultables à partir de numérisations. De plus, il permet de corriger automatiquement les fautes d’orthographe dans le texte reconnu.

La classe AsposeOcr est l’API principale de la bibliothèque Aspose OCR. Il fournit diverses méthodes pour effectuer des opérations d’OCR. La méthode RecognizeImage() de cette classe reconnaît le texte sur les images des formats pris en charge. La méthode CorrectSpelling() de l’API remplace les mots mal orthographiés par des mots corrects dans le texte. La classe RecognitionResult représente les résultats de la reconnaissance d’image. La méthode Save(string, SaveFormat, bool, SpellCheckLanguage, string) de cette classe enregistre le document en texte brut, PDF ou Microsoft Word Document. Toutes les langues prises en charge pour la vérification orthographique sont définies dans l’énumération SpellCheckLanguage.

Veuillez soit télécharger la DLL de l’API ou l’installer à l’aide de NuGet.

PM> Install-Package Aspose.OCR

Image OCR en texte et correction des fautes d’orthographe en C#

Nous pouvons effectuer l’OCR sur les images et obtenir une liste des fautes d’orthographe dans le texte reconnu en suivant les étapes ci-dessous :

  1. Tout d’abord, créez une instance de la classe AsposeOcr.
  2. Ensuite, initialisez un objet de la classe RecognitionSettings.
  3. Ensuite, obtenez RecognitionResult en appelant la méthode RecognizeImage(). Il prend le chemin de l’image et l’objet RecognitionSettings comme arguments.
  4. Après cela, appelez la méthode GetSpellCheckErrorList() pour obtenir une liste de mots mal orthographiés avec des suggestions.
  5. Enfin, parcourez la liste SpellCheckError et affichez les résultats.

L’exemple de code suivant montre comment obtenir une liste des fautes d’orthographe à partir d’un texte reconnu en C#.

// Cet exemple de code montre comment obtenir une liste de mots mal orthographiés à partir d'un texte reconnu.
// Chemin vers l'image à reconnaître
string imagePath = @"C:\Files\OCR\sample.png";

// Créer une API OCR
AsposeOcr api = new AsposeOcr();

// Initialiser les paramètres de reconnaissance
RecognitionSettings settings = new RecognitionSettings();

// Reconnaître l'image           
RecognitionResult result = api.RecognizeImage(imagePath, settings);

// Obtenir la liste des mots mal orthographiés avec des suggestions
List<SpellCheckError> errorsList = result.GetSpellCheckErrorList(SpellCheckLanguage.Eng);

foreach (var word in errorsList)
{
    Console.WriteLine($"Misspelled Word - {word.Word}");
    foreach (var suggest in word.SuggestedWords)
    {
        Console.WriteLine($"Suggested word - {suggest.Word}");
    }

    Console.WriteLine();
}
Image OCR en texte et correction des fautes d'orthographe en C#

Obtenir une liste des fautes d’orthographe en C#

Convertir une image en texte avec correction orthographique en C#

Nous pouvons convertir une image en texte et corriger automatiquement les fautes d’orthographe en suivant les étapes ci-dessous :

  1. Tout d’abord, créez une instance de la classe AsposeOcr.
  2. Ensuite, initialisez un objet de la classe RecognitionSettings.
  3. Ensuite, obtenez RecognitionResult en appelant la méthode RecognizeImage(). Il prend le chemin de l’image et l’objet RecognitionSettings comme arguments.
  4. Après cela, appelez la méthode GetSpellCheckCorrectedText() pour obtenir du texte avec correction orthographique.
  5. Enfin, montrez les résultats.

L’exemple de code suivant montre comment corriger automatiquement les fautes d’orthographe à partir d’un texte reconnu en C#.

// Cet exemple de code montre comment corriger automatiquement les fautes d'orthographe à partir d'un texte reconnu.
// Chemin vers l'image à reconnaître
string imagePath = @"C:\Files\OCR\sample.png";

// Créer une API OCR
AsposeOcr api = new AsposeOcr();

// Initialiser les paramètres de reconnaissance
RecognitionSettings settings = new RecognitionSettings();

// Reconnaître le texte d'une image    
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Obtenir un résultat corrigé
string correctedResult = result.GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Montrer les résultats
Console.WriteLine(correctedResult);
Convertir une image en texte avec correction orthographique en C#

Convertir une image en texte avec correction orthographique en C#

Enregistrer le texte reconnu avec l’orthographe corrigée en C#

Nous pouvons enregistrer le texte reconnu à partir d’une image après correction orthographique en suivant les étapes ci-dessous :

  1. Tout d’abord, créez une instance de la classe AsposeOcr.
  2. Ensuite, initialisez un objet de la classe RecognitionSettings.
  3. Après cela, obtenez RecognitionResult en appelant la méthode RecognizeImage(). Il prend le chemin de l’image et l’objet RecognitionSettings comme arguments.
  4. Enfin, appelez la méthode Save(string, SaveFormat, bool, SpellCheckLanguage) pour enregistrer le texte. Il prend la valeur booléenne de applySpellingCorrection comme true.

L’exemple de code suivant montre comment enregistrer le texte avec correction orthographique en C#.

// Cet exemple de code montre comment enregistrer le texte reconnu avec correction orthographique.
// Chemin vers l'image à reconnaître
string imagePath = @"C:\Files\OCR\sample.png";
string resultPath = @"C:\Files\OCR\MyResult.txt";

// Créer une API OCR
AsposeOcr api = new AsposeOcr();

// Initialiser les paramètres de reconnaissance
RecognitionSettings settings = new RecognitionSettings();
         
// Reconnaître le texte d'une image 
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Enregistrez le texte corrigé
result.Save(resultPath, SaveFormat.Text, true, SpellCheckLanguage.Eng);

Vérification orthographique du texte en C#

Nous pouvons également exécuter une vérification orthographique sur un texte personnalisé en suivant les étapes ci-dessous :

  1. Tout d’abord, créez une instance de la classe AsposeOcr.
  2. Ensuite, appelez la méthode CorrectSpelling(). Il prend le texte à corriger et SpellCheckLanguage comme arguments.
  3. Enfin, montrez les résultats.

L’exemple de code suivant montre comment vérifier l’orthographe d’un texte personnalisé en C#.

// Cet exemple de code montre comment exécuter la vérification orthographique sur une chaîne de texte personnalisée.
// Texte pour le correcteur orthographique
string textToCorrect = "This is sample text wth errrors";

// Créer une API OCR
AsposeOcr api = new AsposeOcr();

// Exécutez la vérification orthographique pour corriger les erreurs
string correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Montrer les résultats
Console.WriteLine(correctedText);
This is sample text with errors

Obtenez une licence d’évaluation gratuite

Vous pouvez obtenir une licence temporaire gratuite pour essayer Aspose.OCR pour .NET sans limitation d’évaluation.

Conclusion

Dans cet article, nous avons appris à :

  • effectuer l’OCR et reconnaître le texte sur l’image en C# ;
  • obtenir une liste des mots mal orthographiés ainsi que des suggestions de mots corrects ;
  • correction automatique des fautes d’orthographe ;
  • enregistrer le texte corrigé par programme.

En outre, vous pouvez en savoir plus sur Aspose.OCR pour l’API .NET en utilisant la documentation. En cas d’ambiguïté, n’hésitez pas à nous contacter sur notre forum.

Voir également