텍스트 정보를 처리하고 분석하는 것은 다양한 분야에서 일반적인 요구 사항입니다. 그러나 이미지의 텍스트를 처리하는 것은 고유한 문제입니다. 다행히 Aspose.OCR for Python via .NET은 이 작업을 효율적으로 처리할 수 있는 강력한 라이브러리와 도구를 제공합니다. 이 블로그 게시물에서는 광학 문자 인식(OCR) 기술을 사용하여 Python에서 이미지의 텍스트를 비교하고 이미지의 텍스트에서 유사성 또는 차이점을 확인하는 방법을 살펴봅니다.
이미지 텍스트를 OCR과 비교 – Python API 설치
OCR은 이미지, 스캔한 문서, 손으로 쓴 자료에서 텍스트를 추출할 수 있는 기술입니다. 컴퓨터 비전 알고리즘을 사용하여 문자를 식별하고 기계가 읽을 수 있는 텍스트로 변환합니다. OCR은 텍스트 비교 또는 차이점 또는 유사점 가져오기와 같은 이미지의 텍스트 분석과 관련된 작업을 자동화하는 데 중요한 역할을 합니다. New Releases 섹션에서 액세스하여 .NET을 통해 Python용 Aspose.OCR을 쉽게 구성하거나 다음 설치 명령을 사용하여 PyPi에서 설치할 수 있습니다.
pip install aspose-ocr-python-net
Python에서 OCR을 사용하여 이미지의 텍스트 비교
서로 다른 이미지의 텍스트를 비교하고 유사한지 여부를 찾을 수 있습니다. 출력은 부울 형식으로 True 또는 False 값으로 생성됩니다. 여기서 True는 텍스트가 유사함을 의미하고 False 값은 텍스트가 유사하지 않음을 의미합니다. 이미지의 텍스트를 Python의 OCR과 비교하려면 아래 단계를 따라야 합니다.
- AsposeOcr 클래스의 객체를 생성합니다.
- 비교를 위해 입력 이미지를 가져옵니다.
- 이미지의 텍스트를 비교하고 결과를 인쇄합니다.
다음 코드 스니펫은 이미지의 텍스트를 Python의 OCR과 비교하는 방법을 보여줍니다.
import aspose.ocr as ocr
# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()
# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()
input1 = "image1.jpg"
input2 = "image1.jpg"
# Recognize the image
result = api.compare_image_texts(input1, input2, settings, True)
# Print recognition result
print(result)
print("Images Compared Successfully")
Python에서 OCR을 사용하여 이미지의 텍스트 유사성 얻기
아래 단계에 따라 Python에서 이미지의 텍스트 유사성 또는 차이점을 얻을 수 있습니다.
- AsposeOcr 클래스의 인스턴스를 초기화합니다.
- [RecognitionSettings][5] 클래스 개체를 인스턴스화합니다.
- 이미지의 텍스트 차이를 계산합니다.
- 출력 결과를 인쇄합니다.
아래 코드 스니펫은 Python에서 이미지의 텍스트에서 유사점 또는 차이점을 얻는 방법을 설명합니다.
import aspose.ocr as ocr
# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()
# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()
input1 = "image1.jpg"
input2 = "image1.jpg"
input3 = "image2.jpg"
# Check difference
result = api.image_text_diff(input1, input2, settings, True)
# Print 1 - equal, 0 - maximum difference
print("Image Texts are " + str(result*100) + "% similar")
# Check difference
result = api.image_text_diff(input1, input3, settings, True)
# Print 1 - equal, 0 - maximum difference
print(result)
print("Image Texts are " + str(result*100) + "% similar")
무료 평가 라이센스 받기
API의 모든 기능을 전체 용량으로 테스트하기 위해 무료 임시 라이선스를 요청할 수 있습니다.
합산
Python에서 OCR 기술을 사용하여 이미지의 텍스트를 비교하면 다양한 도메인에서 광범위한 가능성이 열립니다. 이미지에서 쉽게 텍스트를 추출하고 비교하여 차이점이나 유사점을 얻을 수 있습니다. 문서 분석, 콘텐츠 확인 또는 표절 탐지 작업을 수행하는 경우 이 접근 방식을 통해 텍스트 비교 워크플로를 간소화할 수 있습니다. 문제가 있는 경우 무료 지원 포럼을 통해 언제든지 문의해 주십시오.