比較圖像文本 OCR Python

處理和分析文本信息是各個領域的共同需求。然而,處理圖像上的文本提出了獨特的挑戰。幸運的是,Aspose.OCR for Python via .NET 提供了強大的庫和工具來有效地解決此任務。在這篇博文中,您將探索如何使用光學字符識別 (OCR) 技術在 Python 中比較圖像上的文本,以及檢查圖像上文本的相似性或差異。

比較圖像文本與 OCR – Python API 安裝

OCR 是一種能夠從圖像、掃描文檔或手寫材料中提取文本的技術。它使用計算機視覺算法來識別字符並將其轉換為機器可讀的文本。 OCR 在涉及圖像文本分析的自動化任務中發揮著至關重要的作用,例如比較文本或獲取差異或相似之處。您可以通過 .NET 輕鬆配置 Aspose.OCR for Python,方法是從 New Releases 部分訪問它,或者使用以下安裝命令從 PyPi 安裝它:

pip install aspose-ocr-python-net

使用 Python 中的 OCR 比較圖像上的文本

您可以比較不同圖像上的文本並查找它們是否相似。輸出以布爾格式生成 True 或 False 值,其中 True 表示文本相似,False 值表示文本不相似。您需要按照以下步驟在 Python 中使用 OCR 比較圖像上的文本:

  1. 創建 AsposeOcr 類的對象。
  2. 獲取輸入圖像進行比較。
  3. 比較圖像中的文本並打印結果。

以下代碼片段演示瞭如何在 Python 中使用 OCR 比較圖像中的文本:

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()

input1 = "image1.jpg"
input2 = "image1.jpg"

# Recognize the image
result = api.compare_image_texts(input1, input2, settings, True)

# Print recognition result
print(result)
print("Images Compared Successfully")

使用 Python 中的 OCR 獲取圖像中的文本相似度

您可以通過以下步驟在Python中獲取圖像中的文本相似性或差異性:

  1. 初始化 AsposeOcr 類的實例。
  2. 實例化 [RecognitionSettings][5] 類對象。
  3. 計算圖像中文本的差異。
  4. 打印輸出結果。

下面的代碼片段解釋瞭如何在Python中獲取圖像中文本的相似或差異:

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()

input1 = "image1.jpg"
input2 = "image1.jpg"
input3 = "image2.jpg"

# Check difference
result = api.image_text_diff(input1, input2, settings, True)

# Print 1 - equal, 0 - maximum difference
print("Image Texts are " + str(result*100) + "% similar")


# Check difference
result = api.image_text_diff(input1, input3, settings, True)

# Print 1 - equal, 0 - maximum difference
print(result)
print("Image Texts are " + str(result*100) + "% similar")

獲取免費評估許可證

您可以請求免費臨時許可證,以充分測試 API 的所有功能。

加起來

在 Python 中使用 OCR 技術比較圖像上的文本為各個領域開闢了廣泛的可能性。您可以輕鬆地從圖像中提取文本,進行比較,並找出差異或相似之處。無論您是進行文檔分析、內容驗證還是抄襲檢測,此方法都將簡化您的文本比較工作流程。如有任何疑問,請隨時通過免費支持論壇與我們聯繫。

也可以看看