Comparer Image Texte OCR Python

Le traitement et l’analyse d’informations textuelles est une exigence commune dans divers domaines. Cependant, traiter du texte sur des images présente un défi unique. Heureusement, Aspose.OCR for Python via .NET propose des bibliothèques et des outils puissants pour s’attaquer efficacement à cette tâche. Dans cet article de blog, vous découvrirez comment comparer du texte sur des images en Python à l’aide de techniques de reconnaissance optique de caractères (OCR), ainsi que vérifier la similitude ou les différences dans le texte sur des images.

Comparer le texte de l’image avec l’OCR - Installation de l’API Python

L’OCR est une technologie qui permet d’extraire du texte à partir d’images, de documents numérisés ou de documents manuscrits. Il utilise des algorithmes de vision par ordinateur pour identifier les caractères et les convertir en texte lisible par machine. L’OCR joue un rôle crucial dans l’automatisation des tâches impliquant l’analyse textuelle des images, telles que la comparaison de texte ou l’obtention des différences ou des similitudes. Vous pouvez facilement configurer Aspose.OCR for Python via .NET en y accédant depuis la section New Releases ou en l’installant depuis PyPi à l’aide de la commande d’installation suivante :

pip install aspose-ocr-python-net

Comparer du texte sur des images avec OCR en Python

Vous pouvez comparer du texte sur différentes images et déterminer si elles sont similaires ou non. La sortie est générée au format booléen sous la forme d’une valeur True ou False où True signifie que le texte est similaire et la valeur False signifie que le texte n’est pas similaire. Vous devez suivre les étapes ci-dessous pour comparer du texte sur des images avec l’OCR en Python :

  1. Créez un objet de classe AsposeOcr.
  2. Obtenez les images d’entrée à des fins de comparaison.
  3. Comparez le texte dans les images et imprimez le résultat.

L’extrait de code suivant montre comment comparer du texte dans des images avec l’OCR en Python :

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()

input1 = "image1.jpg"
input2 = "image1.jpg"

# Recognize the image
result = api.compare_image_texts(input1, input2, settings, True)

# Print recognition result
print(result)
print("Images Compared Successfully")

Obtenir la similarité du texte dans les images avec OCR en Python

Vous pouvez obtenir des similitudes ou des différences de texte dans les images en Python en suivant les étapes ci-dessous :

  1. Initialisez une instance de la classe AsposeOcr.
  2. Instanciez l’objet de classe [RecognitionSettings][5].
  3. Calculez la différence de texte dans les images.
  4. Imprimez le résultat de sortie.

L’extrait de code ci-dessous explique comment obtenir des similitudes ou des différences dans le texte des images en Python :

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()

input1 = "image1.jpg"
input2 = "image1.jpg"
input3 = "image2.jpg"

# Check difference
result = api.image_text_diff(input1, input2, settings, True)

# Print 1 - equal, 0 - maximum difference
print("Image Texts are " + str(result*100) + "% similar")


# Check difference
result = api.image_text_diff(input1, input3, settings, True)

# Print 1 - equal, 0 - maximum difference
print(result)
print("Image Texts are " + str(result*100) + "% similar")

Obtenez une licence d’évaluation gratuite

Vous pouvez demander une licence temporaire gratuite pour tester toutes les fonctionnalités de l’API dans leur pleine capacité.

Résumé

La comparaison de texte sur des images à l’aide de techniques OCR en Python ouvre un large éventail de possibilités dans divers domaines. Vous pouvez facilement extraire du texte à partir d’images, le comparer et obtenir les différences ou les similitudes. Que vous travailliez sur l’analyse de documents, la vérification de contenu ou la détection de plagiat, cette approche rationalisera votre flux de travail de comparaison de texte. En cas de problème, n’hésitez pas à nous contacter via le forum d’assistance gratuit.

Voir également