Nous pouvons effectuer l’OCR sur des images ou des documents numérisés pour reconnaître et extraire le texte des images par programmation à l’aide de Java. Nous pouvons ensuite exécuter un correcteur orthographique pour corriger les fautes d’orthographe dans le texte reconnu. Dans cet article, nous allons apprendre à convertir une image en texte avec correction orthographique en Java.
Les sujets suivants seront traités dans cet article :
- Convertisseur d’image Java en texte avec correction orthographique
- Image OCR en texte et correction des fautes d’orthographe
- Convertir l’image en texte avec correction orthographique
- Enregistrer l’image dans le texte avec des orthographes corrigées
- Texte personnalisé de vérification orthographique
Convertisseur d’image en texte Java avec correction orthographique
Pour convertir une image en texte avec des corrections orthographiques, nous utiliserons l’API Aspose.OCR for Java. Il permet d’effectuer l’OCR sur des images numérisées, des photos de smartphone, des captures d’écran, des zones d’une image et des PDF numérisés. Il nous permet d’enregistrer les résultats de texte reconnus dans formats de documents populaires. L’API permet également de convertir des images en texte et de corriger automatiquement les fautes d’orthographe dans le texte reconnu.
La classe AsposeOCR est l’API principale pour effectuer des opérations OCR. La méthode RecognizePage(String fullPath, RecognitionSettings settings) de cette classe reconnaît le texte sur les images des formats pris en charge. La méthode CorrectSpelling(String text, SpellCheckLanguage language) de l’API remplace les mots mal orthographiés par des mots corrects dans le texte. La classe RecognitionResult représente les résultats de la reconnaissance d’image. La méthode saveSpellCheckCorrectedText(string, Format, SpellCheckLanguage, string) de cette classe enregistre le document en tant que texte brut, PDF ou Document Microsoft Word. Toutes les langues prises en charge pour la vérification orthographique sont définies dans l’énumération SpellCheckLanguage.
Veuillez soit télécharger le JAR de l’API ou ajouter la configuration pom.xml suivante dans une application Java basée sur Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.6</version>
</dependency>
Image OCR en texte et correction des fautes d’orthographe en Java
Nous pouvons effectuer l’OCR sur les images et obtenir une liste des fautes d’orthographe dans le texte reconnu en suivant les étapes ci-dessous :
- Tout d’abord, créez une instance de la classe AsposeOCR.
- Ensuite, initialisez un objet de la classe RecognitionSettings.
- Ensuite, obtenez RecognitionResult en appelant la méthode RecognizePage(). Il prend le chemin de l’image et l’objet RecognitionSettings comme arguments.
- Après cela, appelez la méthode getSpellCheckErrorList() pour obtenir une liste de mots mal orthographiés avec des suggestions.
- Enfin, parcourez la liste SpellCheckError et affichez les résultats.
L’exemple de code suivant montre comment obtenir une liste des fautes d’orthographe à partir d’un texte reconnu en Java.
// Cet exemple de code montre comment obtenir une liste de fautes d'orthographe à partir d'un texte reconnu
String imagePath = "C:\\Files\\sample.jpg";
// Créer une API OCR
AsposeOCR api = new AsposeOCR();
// Initialiser les paramètres de reconnaissance
RecognitionSettings settings = new RecognitionSettings();
// Reconnaître l'image
RecognitionResult result = api.RecognizePage(imagePath, settings);
// Obtenir la liste des mots mal orthographiés avec des suggestions
List<SpellCheckError> errorsList = result.getSpellCheckErrorList(SpellCheckLanguage.Eng);
for (SpellCheckError error : errorsList)
{
// Afficher le mot
System.out.println("Misspelled Word - " + error.word);
// Afficher les mots suggérés
for(SuggestedWord suggest : error.suggestedWords)
{
System.out.println("Suggested word - " + suggest.word);
}
System.out.println();
}
Convertir une image en texte avec correction orthographique en Java
Nous pouvons convertir une image en texte et corriger automatiquement les fautes d’orthographe en suivant les étapes ci-dessous :
- Tout d’abord, créez une instance de la classe AsposeOCR.
- Ensuite, initialisez un objet de la classe RecognitionSettings.
- Ensuite, obtenez RecognitionResult en appelant la méthode RecognizePage(). Il prend le chemin de l’image et l’objet RecognitionSettings comme arguments.
- Après cela, appelez la méthode getSpellCheckCorrectedText() pour obtenir du texte avec correction orthographique.
- Enfin, montrez les résultats.
L’exemple de code suivant montre comment corriger automatiquement les fautes d’orthographe d’un texte reconnu en Java.
// Cet exemple de code montre comment corriger automatiquement les fautes d'orthographe à partir d'un texte reconnu.
// Chemin vers l'image à reconnaître
String imagePath = "C:\\Files\\sample.jpg";
// Créer une API OCR
AsposeOCR api = new AsposeOCR();
// Initialiser les paramètres de reconnaissance
RecognitionSettings settings = new RecognitionSettings();
// Reconnaître le texte d'une image
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());
// Obtenir un résultat corrigé
String correctedResult = result.getSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Montrer les résultats
System.out.println(correctedResult);
Enregistrer l’image en texte avec l’orthographe corrigée en Java
Nous pouvons enregistrer le texte reconnu à partir d’une image après correction orthographique en suivant les étapes ci-dessous :
- Tout d’abord, créez une instance de la classe AsposeOCR.
- Ensuite, initialisez un objet de la classe RecognitionSettings.
- Après cela, obtenez RecognitionResult en appelant la méthode RecognizePage(). Il prend le chemin de l’image et l’objet RecognitionSettings comme arguments.
- Enfin, appelez la méthode saveSpellCheckCorrectedText() pour enregistrer le texte.
L’exemple de code suivant montre comment enregistrer le texte avec correction orthographique en Java.
// Cet exemple de code montre comment enregistrer le texte reconnu avec correction orthographique.
// Chemin vers l'image à reconnaître
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";
// Créer une API OCR
AsposeOCR api = new AsposeOCR();
// Initialiser les paramètres de reconnaissance
RecognitionSettings settings = new RecognitionSettings();
// Reconnaître le texte d'une image
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());
// Enregistrez le texte corrigé
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);
Vérification orthographique du texte en Java
Nous pouvons également exécuter une vérification orthographique sur un texte personnalisé en suivant les étapes ci-dessous :
- Tout d’abord, créez une instance de la classe AsposeOCR.
- Ensuite, appelez la méthode CorrectSpelling(). Il prend le texte à corriger et SpellCheckLanguage comme arguments.
- Enfin, montrez les résultats.
L’exemple de code suivant montre comment vérifier l’orthographe d’un texte personnalisé en Java.
// Cet exemple de code montre comment exécuter la vérification orthographique sur une chaîne de texte personnalisée.
// Texte pour le correcteur orthographique
String textToCorrect = "This is sample text wth errrors";
// Créer une API OCR
AsposeOCR api = new AsposeOCR();
// Exécutez la vérification orthographique pour corriger les erreurs
String correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);
// Montrer les résultats
System.out.println(correctedText);
This is sample text with errors
Get a Free Evaluation License
Vous pouvez obtenir une licence temporaire gratuite pour essayer Aspose.OCR pour Java sans limitation d’évaluation.
Conclusion
Dans cet article, nous avons appris à :
- effectuer l’OCR et reconnaître le texte sur les images ;
- convertir des images en texte ;
- obtenir une liste des mots mal orthographiés ainsi que des suggestions de mots corrects ;
- correction automatique des fautes d’orthographe ;
- enregistrez le texte corrigé à l’aide de Java.
Outre la conversion d’une image en texte avec des corrections orthographiques, vous pouvez en savoir plus sur Aspose.OCR pour l’API Java en utilisant la documentation. En cas d’ambiguïté, n’hésitez pas à nous contacter sur notre forum d’assistance gratuit.