Image OCR en texte et correction orthographique en Java

Nous pouvons effectuer l’OCR sur des images ou des documents numérisés pour reconnaître et extraire le texte des images par programmation à l’aide de Java. Nous pouvons ensuite exécuter un correcteur orthographique pour corriger les fautes d’orthographe dans le texte reconnu. Dans cet article, nous allons apprendre à convertir une image en texte avec correction orthographique en Java.

Les sujets suivants seront traités dans cet article :

  1. Convertisseur d’image Java en texte avec correction orthographique
  2. Image OCR en texte et correction des fautes d’orthographe
  3. Convertir l’image en texte avec correction orthographique
  4. Enregistrer l’image dans le texte avec des orthographes corrigées
  5. Texte personnalisé de vérification orthographique

Convertisseur d’image en texte Java avec correction orthographique

Pour convertir une image en texte avec des corrections orthographiques, nous utiliserons l’API Aspose.OCR for Java. Il permet d’effectuer l’OCR sur des images numérisées, des photos de smartphone, des captures d’écran, des zones d’une image et des PDF numérisés. Il nous permet d’enregistrer les résultats de texte reconnus dans formats de documents populaires. L’API permet également de convertir des images en texte et de corriger automatiquement les fautes d’orthographe dans le texte reconnu.

La classe AsposeOCR est l’API principale pour effectuer des opérations OCR. La méthode RecognizePage(String fullPath, RecognitionSettings settings) de cette classe reconnaît le texte sur les images des formats pris en charge. La méthode CorrectSpelling(String text, SpellCheckLanguage language) de l’API remplace les mots mal orthographiés par des mots corrects dans le texte. La classe RecognitionResult représente les résultats de la reconnaissance d’image. La méthode saveSpellCheckCorrectedText(string, Format, SpellCheckLanguage, string) de cette classe enregistre le document en tant que texte brut, PDF ou Document Microsoft Word. Toutes les langues prises en charge pour la vérification orthographique sont définies dans l’énumération SpellCheckLanguage.

Veuillez soit télécharger le JAR de l’API ou ajouter la configuration pom.xml suivante dans une application Java basée sur Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>22.6</version>
</dependency>

Image OCR en texte et correction des fautes d’orthographe en Java

Nous pouvons effectuer l’OCR sur les images et obtenir une liste des fautes d’orthographe dans le texte reconnu en suivant les étapes ci-dessous :

  1. Tout d’abord, créez une instance de la classe AsposeOCR.
  2. Ensuite, initialisez un objet de la classe RecognitionSettings.
  3. Ensuite, obtenez RecognitionResult en appelant la méthode RecognizePage(). Il prend le chemin de l’image et l’objet RecognitionSettings comme arguments.
  4. Après cela, appelez la méthode getSpellCheckErrorList() pour obtenir une liste de mots mal orthographiés avec des suggestions.
  5. Enfin, parcourez la liste SpellCheckError et affichez les résultats.

L’exemple de code suivant montre comment obtenir une liste des fautes d’orthographe à partir d’un texte reconnu en Java.

// Cet exemple de code montre comment obtenir une liste de fautes d'orthographe à partir d'un texte reconnu
String imagePath = "C:\\Files\\sample.jpg";

// Créer une API OCR
AsposeOCR api = new AsposeOCR();

// Initialiser les paramètres de reconnaissance
RecognitionSettings settings = new RecognitionSettings();

// Reconnaître l'image           
RecognitionResult result = api.RecognizePage(imagePath, settings);

// Obtenir la liste des mots mal orthographiés avec des suggestions
List<SpellCheckError> errorsList = result.getSpellCheckErrorList(SpellCheckLanguage.Eng);

for (SpellCheckError error : errorsList)
{
    // Afficher le mot
    System.out.println("Misspelled Word - " + error.word);
  
    // Afficher les mots suggérés
    for(SuggestedWord suggest : error.suggestedWords)
    {
      System.out.println("Suggested word - " + suggest.word);
    }

    System.out.println();
}
Image OCR en texte et correction des fautes d'orthographe en Java

Obtenir une liste des fautes d’orthographe en Java

Convertir une image en texte avec correction orthographique en Java

Nous pouvons convertir une image en texte et corriger automatiquement les fautes d’orthographe en suivant les étapes ci-dessous :

  1. Tout d’abord, créez une instance de la classe AsposeOCR.
  2. Ensuite, initialisez un objet de la classe RecognitionSettings.
  3. Ensuite, obtenez RecognitionResult en appelant la méthode RecognizePage(). Il prend le chemin de l’image et l’objet RecognitionSettings comme arguments.
  4. Après cela, appelez la méthode getSpellCheckCorrectedText() pour obtenir du texte avec correction orthographique.
  5. Enfin, montrez les résultats.

L’exemple de code suivant montre comment corriger automatiquement les fautes d’orthographe d’un texte reconnu en Java.

// Cet exemple de code montre comment corriger automatiquement les fautes d'orthographe à partir d'un texte reconnu.
// Chemin vers l'image à reconnaître
String imagePath = "C:\\Files\\sample.jpg";

// Créer une API OCR
AsposeOCR api = new AsposeOCR();

// Initialiser les paramètres de reconnaissance
RecognitionSettings settings = new RecognitionSettings();

// Reconnaître le texte d'une image    
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Obtenir un résultat corrigé
String correctedResult = result.getSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Montrer les résultats
System.out.println(correctedResult);
Convertir une image en texte avec correction orthographique en Java

Convertir une image en texte avec correction orthographique en Java

Enregistrer l’image en texte avec l’orthographe corrigée en Java

Nous pouvons enregistrer le texte reconnu à partir d’une image après correction orthographique en suivant les étapes ci-dessous :

  1. Tout d’abord, créez une instance de la classe AsposeOCR.
  2. Ensuite, initialisez un objet de la classe RecognitionSettings.
  3. Après cela, obtenez RecognitionResult en appelant la méthode RecognizePage(). Il prend le chemin de l’image et l’objet RecognitionSettings comme arguments.
  4. Enfin, appelez la méthode saveSpellCheckCorrectedText() pour enregistrer le texte.

L’exemple de code suivant montre comment enregistrer le texte avec correction orthographique en Java.

// Cet exemple de code montre comment enregistrer le texte reconnu avec correction orthographique.
// Chemin vers l'image à reconnaître
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";

// Créer une API OCR
AsposeOCR api = new AsposeOCR();

// Initialiser les paramètres de reconnaissance
RecognitionSettings settings = new RecognitionSettings();

// Reconnaître le texte d'une image 
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Enregistrez le texte corrigé
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);

Vérification orthographique du texte en Java

Nous pouvons également exécuter une vérification orthographique sur un texte personnalisé en suivant les étapes ci-dessous :

  1. Tout d’abord, créez une instance de la classe AsposeOCR.
  2. Ensuite, appelez la méthode CorrectSpelling(). Il prend le texte à corriger et SpellCheckLanguage comme arguments.
  3. Enfin, montrez les résultats.

L’exemple de code suivant montre comment vérifier l’orthographe d’un texte personnalisé en Java.

// Cet exemple de code montre comment exécuter la vérification orthographique sur une chaîne de texte personnalisée.
// Texte pour le correcteur orthographique
String textToCorrect = "This is sample text wth errrors";

// Créer une API OCR
AsposeOCR api = new AsposeOCR();

// Exécutez la vérification orthographique pour corriger les erreurs
String correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Montrer les résultats
System.out.println(correctedText);
This is sample text with errors

Get a Free Evaluation License

Vous pouvez obtenir une licence temporaire gratuite pour essayer Aspose.OCR pour Java sans limitation d’évaluation.

Conclusion

Dans cet article, nous avons appris à :

  • effectuer l’OCR et reconnaître le texte sur les images ;
  • convertir des images en texte ;
  • obtenir une liste des mots mal orthographiés ainsi que des suggestions de mots corrects ;
  • correction automatique des fautes d’orthographe ;
  • enregistrez le texte corrigé à l’aide de Java.

Outre la conversion d’une image en texte avec des corrections orthographiques, vous pouvez en savoir plus sur Aspose.OCR pour l’API Java en utilisant la documentation. En cas d’ambiguïté, n’hésitez pas à nous contacter sur notre forum d’assistance gratuit.

See Also