Comparar texto de imagem OCR Python

Processar e analisar informações textuais é um requisito comum em vários campos. No entanto, lidar com texto em imagens apresenta um desafio único. Felizmente, Aspose.OCR para Python via .NET oferece bibliotecas e ferramentas poderosas para lidar com essa tarefa com eficiência. Nesta postagem do blog, você explorará como comparar texto em imagens em Python usando técnicas de reconhecimento óptico de caracteres (OCR), bem como verificar a semelhança ou diferenças no texto nas imagens.

Comparar texto de imagem com OCR – instalação da API Python

OCR é uma tecnologia que permite a extração de texto de imagens, documentos digitalizados ou materiais manuscritos. Ele usa algoritmos de visão computacional para identificar caracteres e convertê-los em texto legível por máquina. O OCR desempenha um papel crucial na automatização de tarefas que envolvem análise textual de imagens, como comparar texto ou obter diferenças ou semelhanças. Você pode facilmente configurar o Aspose.OCR para Python via .NET acessando-o na seção New Releases ou instalá-lo em PyPi usando o seguinte comando de instalação:

pip install aspose-ocr-python-net

Comparar texto em imagens com OCR em Python

Você pode comparar o texto em imagens diferentes e descobrir se são semelhantes ou não. A saída é gerada no formato booleano como um valor True ou False, onde True significa que o texto é semelhante e o valor False significa que o texto não é semelhante. Você precisa seguir as etapas abaixo para comparar texto em imagens com OCR em Python:

  1. Crie um objeto da classe AsposeOcr.
  2. Obtenha as imagens de entrada para comparação.
  3. Compare o texto nas imagens e imprima o resultado.

O trecho de código a seguir demonstra como comparar texto em imagens com OCR em Python:

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()

input1 = "image1.jpg"
input2 = "image1.jpg"

# Recognize the image
result = api.compare_image_texts(input1, input2, settings, True)

# Print recognition result
print(result)
print("Images Compared Successfully")

Obter similaridade de texto em imagens com OCR em Python

Você pode obter semelhanças ou diferenças de texto nas imagens em Python seguindo as etapas abaixo:

  1. Inicialize uma instância da classe AsposeOcr.
  2. Crie uma instância do objeto de classe [RecognitionSettings][5].
  3. Calcule a diferença de texto nas imagens.
  4. Imprima o resultado da saída.

O trecho de código abaixo explica como obter semelhanças ou diferenças no texto em imagens em Python:

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()

input1 = "image1.jpg"
input2 = "image1.jpg"
input3 = "image2.jpg"

# Check difference
result = api.image_text_diff(input1, input2, settings, True)

# Print 1 - equal, 0 - maximum difference
print("Image Texts are " + str(result*100) + "% similar")


# Check difference
result = api.image_text_diff(input1, input3, settings, True)

# Print 1 - equal, 0 - maximum difference
print(result)
print("Image Texts are " + str(result*100) + "% similar")

Obtenha uma licença de avaliação gratuita

Você pode solicitar uma licença temporária gratuita para testar todos os recursos da API em sua capacidade total.

Resumindo

A comparação de texto em imagens usando técnicas de OCR em Python abre uma ampla gama de possibilidades em vários domínios. Você pode facilmente extrair texto de imagens, compará-lo e obter as diferenças ou semelhanças. Esteja você trabalhando na análise de documentos, verificação de conteúdo ou detecção de plágio, essa abordagem simplificará seu fluxo de trabalho de comparação de texto. Em caso de dúvidas, sinta-se à vontade para nos contatar através do fórum de suporte gratuito.

Veja também