Texte d'image en texte en Python | Texte d'image Python en texte

La conversion de texte à partir d’images en formats modifiables est une tâche cruciale pour diverses applications. Que vous travailliez avec des documents numérisés, des cartes de visite ou des notes manuscrites, l’extraction de texte à partir d’images peut considérablement gagner du temps et améliorer la productivité. Dans cet article de blog, nous apprendrons comment convertir du texte d’images en texte en Python.

Cet article couvre les sujets suivants :

Convertisseur de texte en texte d’image Python

Nous utiliserons Aspose.OCR for Python pour convertir le texte des images en texte (TXT).Aspose.OCR for Python est une puissante bibliothèque de reconnaissance optique de caractères (OCR) qui permet aux développeurs d’extraire du texte à partir d’images et de documents numérisés dans des applications Python.

Tout d’abord, nous devons installer la bibliothèque Aspose.OCR. Vous pouvez facilement télécharger le package ou installer l’API depuis PyPI à l’aide de la commande pip suivante dans la console :

pip install aspose-ocr-python-net 

Convertir du texte d’image en texte en Python

Nous pouvons convertir le texte d’une image et l’enregistrer dans un fichier texte (TXT).Veuillez suivre les étapes ci-dessous pour extraire par programme le texte des images et l’enregistrer en tant que fichier texte.

  1. Créez une instance de l’objet de classe AsposeOcr.
  2. Instanciez l’objet de classe OcrInput avec InputType.SINGLEIMAGE comme argument.
  3. Ajoutez l’image à l’aide de la méthode add().De même, ajoutez plus d’images.
  4. Après cela, appelez la méthode reconnaître() avec l’objet OcrInput comme argument.
  5. Enfin, enregistrez le résultat sous forme de fichier texte à l’aide de la méthode save().

L’exemple de code suivant montre comment convertir le texte d’une image en fichier texte en Python.

# Cet exemple de code montre comment extraire le texte d'une image et l'enregistrer en tant que fichier texte en Python
import aspose.ocr as ocr

# Instancier l'API Aspose.OCR
api = ocr.AsposeOcr()

# Ajouter une image au lot de reconnaissance
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")

# Reconnaître l'image
result = api.recognize(img)

# Résultat de la reconnaissance d'impression
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Convertisseur de texte d'image en texte en Python.

Convertisseur de texte d’image en texte en Python.

Texte d’image en texte - Méthode avancée

De même, nous pouvons ajouter des filtres tels que « autoskew » et définir des options de reconnaissance telles que les modes de zone, la langue, etc. lors de la conversion du texte des images en fichiers texte. Veuillez suivre les étapes ci-dessous pour ajouter des filtres et des paramètres de reconnaissance.

  1. Créez une instance de l’objet de classe AsposeOcr.
  2. Initialisez un objet de la classe PreprocessingFilters.
  3. Ajoutez les filtres à l’aide de la méthode add().
  4. Instanciez l’objet de classe OcrInput avec InputType.SINGLEIMAGE et filtre l’objet en tant qu’arguments.
  5. Ajoutez l’image à l’aide de la méthode add().De même, ajoutez plus d’images.
  6. Initialisez l’objet de classe RecognitionSettings.
  7. Spécifiez les options de reconnaissance.
  8. Après cela, appelez la méthode reconnaître() avec l’objet OcrInput comme argument.
  9. Enfin, enregistrez le résultat sous forme de fichier texte à l’aide de la méthode save().

L’exemple de code suivant montre comment spécifier des filtres et des paramètres de reconnaissance pour convertir le texte d’une image en fichier texte en Python.

# Cet exemple de code montre comment extraire le texte en anglais d'une image et l'enregistrer en tant que fichier texte en Python.
import aspose.ocr as ocr

# Instancier l'API Aspose.OCR
api = ocr.AsposeOcr()

# définir les options de prétraitement
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())

# Ajouter une image au lot de reconnaissance
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")

# Définir les options de reconnaissance
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG

# Reconnaître
result = api.recognize(img, settings)

# Résultat de la reconnaissance d'impression
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);

Bibliothèque Python OCR – Obtenez une licence gratuite

Visitez notre page « Licence temporaire » pour savoir comment obtenir une licence gratuite facilement et débloquer un accès illimité à la bibliothèque Python OCR. Commencez dès aujourd’hui à convertir le texte des images en fichiers texte !

Convertisseur de texte d’image en texte - Ressources gratuites

Explorez les ressources ci-dessous pour en savoir plus sur les fonctionnalités et capacités de la bibliothèque :

Conclusion

Dans cet article de blog, nous avons montré comment utiliser Aspose.OCR for Python pour convertir le texte des images en fichiers TXT. En suivant les étapes décrites ci-dessus, vous pouvez facilement intégrer la fonctionnalité OCR dans vos applications Python, vous permettant d’extraire et de traiter le texte de différents types d’images. Que vous travailliez sur la numérisation de documents, l’extraction de données ou toute autre tâche liée à l’OCR, Aspose.OCR fournit une solution fiable et efficace. Bon codage !

En cas d’ambiguïté, n’hésitez pas à nous contacter sur notre forum d’assistance gratuit.

Voir également