Comparar Imagen Texto OCR Python

Procesar y analizar información textual es un requisito común en varios campos. Sin embargo, tratar con texto en imágenes presenta un desafío único. Afortunadamente, Aspose.OCR for Python a través de .NET ofrece poderosas bibliotecas y herramientas para abordar esta tarea de manera eficiente. En esta publicación de blog, explorará cómo comparar texto en imágenes en Python utilizando técnicas de reconocimiento óptico de caracteres (OCR), así como verificar la similitud o las diferencias en el texto de las imágenes.

Comparar texto de imagen con OCR: instalación de la API de Python

OCR es una tecnología que permite la extracción de texto de imágenes, documentos escaneados o materiales escritos a mano. Utiliza algoritmos de visión por computadora para identificar caracteres y convertirlos en texto legible por máquina. OCR juega un papel crucial en la automatización de tareas que involucran el análisis textual de imágenes, como comparar texto u obtener las diferencias o similitudes. Puede configurar fácilmente Aspose.OCR for Python a través de .NET accediendo desde la sección Nuevos lanzamientos o instalarlo desde PyPi usando el siguiente comando de instalación:

pip install aspose-ocr-python-net

Compara texto en imágenes con OCR en Python

Puede comparar texto en diferentes imágenes y encontrar si son similares o no. La salida se genera en formato booleano como un valor verdadero o falso, donde verdadero significa que el texto es similar y el valor falso significa que el texto no es similar. Debe seguir los pasos a continuación para comparar texto en imágenes con OCR en Python:

  1. Cree un objeto de la clase AsposeOcr.
  2. Obtenga las imágenes de entrada para comparar.
  3. Compara el texto de las imágenes e imprime el resultado.

El siguiente fragmento de código demuestra cómo comparar texto en imágenes con OCR en Python:

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()

input1 = "image1.jpg"
input2 = "image1.jpg"

# Recognize the image
result = api.compare_image_texts(input1, input2, settings, True)

# Print recognition result
print(result)
print("Images Compared Successfully")

Obtener similitud de texto en imágenes con OCR en Python

Puede obtener similitudes o diferencias de texto en las imágenes en Python siguiendo los pasos a continuación:

  1. Inicialice una instancia de la clase AsposeOcr.
  2. Cree una instancia del objeto de clase [RecognitionSettings][5].
  3. Calcula la diferencia de texto en las imágenes.
  4. Imprime el resultado de la salida.

El fragmento de código a continuación explica cómo obtener similitudes o diferencias en el texto de las imágenes en Python:

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()

input1 = "image1.jpg"
input2 = "image1.jpg"
input3 = "image2.jpg"

# Check difference
result = api.image_text_diff(input1, input2, settings, True)

# Print 1 - equal, 0 - maximum difference
print("Image Texts are " + str(result*100) + "% similar")


# Check difference
result = api.image_text_diff(input1, input3, settings, True)

# Print 1 - equal, 0 - maximum difference
print(result)
print("Image Texts are " + str(result*100) + "% similar")

Obtenga una licencia de evaluación gratuita

Puede solicitar una licencia temporal gratuita para probar todas las funciones de la API en toda su capacidad.

Resumiendo

La comparación de texto en imágenes usando técnicas de OCR en Python abre una amplia gama de posibilidades en varios dominios. Puede extraer fácilmente texto de las imágenes, compararlo y obtener las diferencias o similitudes. Ya sea que esté trabajando en el análisis de documentos, la verificación de contenido o la detección de plagio, este enfoque agilizará su flujo de trabajo de comparación de textos. Si tiene alguna inquietud, no dude en comunicarse con nosotros a través del foro de soporte gratuito.

Ver también