Przetwarzanie i analiza informacji tekstowych jest powszechnym wymogiem w różnych dziedzinach. Jednak radzenie sobie z tekstem na obrazach stanowi wyjątkowe wyzwanie. Na szczęście Aspose.OCR for Python via .NET oferuje potężne biblioteki i narzędzia, które skutecznie poradzą sobie z tym zadaniem. W tym poście na blogu dowiesz się, jak porównywać tekst na obrazach w Python za pomocą technik optycznego rozpoznawania znaków (OCR), a także sprawdzać podobieństwa lub różnice w tekście na obrazach.
- Porównaj tekst obrazu z OCR – instalacja API Python
- Porównaj tekst na obrazach z OCR w Python
- Uzyskaj podobieństwo tekstu w obrazach za pomocą OCR w Python
Porównaj tekst obrazu z OCR – instalacja API Python
OCR to technologia umożliwiająca wyodrębnienie tekstu z obrazów, zeskanowanych dokumentów lub materiałów pisanych odręcznie. Wykorzystuje algorytmy widzenia komputerowego do identyfikowania znaków i przekształcania ich w tekst do odczytu maszynowego. OCR odgrywa kluczową rolę w automatyzacji zadań związanych z tekstową analizą obrazów, takich jak porównywanie tekstu lub znajdowanie różnic lub podobieństw. Możesz łatwo skonfigurować Aspose.OCR for Python przez .NET, uzyskując do niego dostęp z sekcji New Releases lub instalując go z PyPi za pomocą następującego polecenia instalacyjnego:
pip install aspose-ocr-python-net
Porównaj tekst na obrazach z OCR w Python
Możesz porównać tekst na różnych obrazach i sprawdzić, czy są one podobne, czy nie. Dane wyjściowe są generowane w formacie boolowskim jako wartość Prawda lub Fałsz, gdzie Prawda oznacza, że tekst jest podobny, a wartość Fałsz oznacza, że tekst nie jest podobny. Musisz wykonać poniższe kroki, aby porównać tekst na obrazach z OCR w Python:
- Utwórz obiekt klasy AsposeOcr.
- Pobierz obrazy wejściowe do porównania.
- Porównaj tekst na obrazach i wydrukuj wynik.
Poniższy fragment kodu pokazuje, jak porównać tekst w obrazach z OCR w Python:
import aspose.ocr as ocr
# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()
# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()
input1 = "image1.jpg"
input2 = "image1.jpg"
# Recognize the image
result = api.compare_image_texts(input1, input2, settings, True)
# Print recognition result
print(result)
print("Images Compared Successfully")
Uzyskaj podobieństwo tekstu w obrazach za pomocą OCR w Python
Możesz uzyskać podobieństwa lub różnice w tekście na obrazach w Python, wykonując poniższe czynności:
- Zainicjuj instancję klasy AsposeOcr.
- Utwórz instancję obiektu klasy [RecognitionSettings][5].
- Oblicz różnicę w tekście na obrazkach.
- Wydrukuj wynik wyjściowy.
Poniższy fragment kodu wyjaśnia, jak uzyskać podobieństwa lub różnice w tekście na obrazach w Python:
import aspose.ocr as ocr
# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()
# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()
input1 = "image1.jpg"
input2 = "image1.jpg"
input3 = "image2.jpg"
# Check difference
result = api.image_text_diff(input1, input2, settings, True)
# Print 1 - equal, 0 - maximum difference
print("Image Texts are " + str(result*100) + "% similar")
# Check difference
result = api.image_text_diff(input1, input3, settings, True)
# Print 1 - equal, 0 - maximum difference
print(result)
print("Image Texts are " + str(result*100) + "% similar")
Uzyskaj bezpłatną licencję ewaluacyjną
Możesz poprosić o bezpłatną tymczasową licencję, aby przetestować wszystkie funkcje interfejsu API w ich pełnej wydajności.
Podsumowując
Porównywanie tekstu na obrazach za pomocą technik OCR w Python otwiera szeroki wachlarz możliwości w różnych dziedzinach. Możesz łatwo wyodrębnić tekst z obrazów, porównać go i znaleźć różnice lub podobieństwa. Niezależnie od tego, czy pracujesz nad analizą dokumentów, weryfikacją treści czy wykrywaniem plagiatu, takie podejście usprawni proces porównywania tekstów. W przypadku jakichkolwiek wątpliwości prosimy o kontakt za pośrednictwem darmowego forum wsparcia.