比较图像文本 OCR Python

处理和分析文本信息是各个领域的共同需求。然而,处理图像上的文本提出了独特的挑战。幸运的是,Aspose.OCR for Python via .NET 提供了强大的库和工具来有效地解决此任务。在这篇博文中,您将探索如何使用光学字符识别 (OCR) 技术在 Python 中比较图像上的文本,以及检查图像上文本的相似性或差异。

比较图像文本与 OCR – Python API 安装

OCR 是一种能够从图像、扫描文档或手写材料中提取文本的技术。它使用计算机视觉算法来识别字符并将其转换为机器可读的文本。 OCR 在涉及图像文本分析的自动化任务中发挥着至关重要的作用,例如比较文本或获取差异或相似之处。您可以通过 .NET 轻松配置 Aspose.OCR for Python,方法是从 New Releases 部分访问它,或者使用以下安装命令从 PyPi 安装它:

pip install aspose-ocr-python-net

使用 Python 中的 OCR 比较图像上的文本

您可以比较不同图像上的文本并查找它们是否相似。输出以布尔格式生成 True 或 False 值,其中 True 表示文本相似,False 值表示文本不相似。您需要按照以下步骤在 Python 中使用 OCR 比较图像上的文本:

  1. 创建 AsposeOcr 类的对象。
  2. 获取输入图像进行比较。
  3. 比较图像中的文本并打印结果。

以下代码片段演示了如何在 Python 中使用 OCR 比较图像中的文本:

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()

input1 = "image1.jpg"
input2 = "image1.jpg"

# Recognize the image
result = api.compare_image_texts(input1, input2, settings, True)

# Print recognition result
print(result)
print("Images Compared Successfully")

使用 Python 中的 OCR 获取图像中的文本相似度

您可以通过以下步骤在Python中获取图像中的文本相似性或差异性:

  1. 初始化 AsposeOcr 类的实例。
  2. 实例化 [RecognitionSettings][5] 类对象。
  3. 计算图像中文本的差异。
  4. 打印输出结果。

下面的代码片段解释了如何在Python中获取图像中文本的相似或差异:

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()

input1 = "image1.jpg"
input2 = "image1.jpg"
input3 = "image2.jpg"

# Check difference
result = api.image_text_diff(input1, input2, settings, True)

# Print 1 - equal, 0 - maximum difference
print("Image Texts are " + str(result*100) + "% similar")


# Check difference
result = api.image_text_diff(input1, input3, settings, True)

# Print 1 - equal, 0 - maximum difference
print(result)
print("Image Texts are " + str(result*100) + "% similar")

获取免费评估许可证

您可以请求免费临时许可证,以充分测试 API 的所有功能。

加起来

在 Python 中使用 OCR 技术比较图像上的文本为各个领域开辟了广泛的可能性。您可以轻松地从图像中提取文本,进行比较,并找出差异或相似之处。无论您是进行文档分析、内容验证还是抄袭检测,此方法都将简化您的文本比较工作流程。如有任何疑问,请随时通过免费支持论坛与我们联系。

也可以看看