Tekst z obrazu na tekst w Python | Tekst obrazu Python na tekst

Konwersja tekstu z obrazów na formaty edytowalne jest kluczowym zadaniem dla różnych aplikacji. Niezależnie od tego, czy pracujesz ze zeskanowanymi dokumentami, wizytówkami czy odręcznymi notatkami, wyodrębnianie tekstu z obrazów może znacznie zaoszczędzić czas i zwiększyć produktywność. W tym poście na blogu dowiemy się, jak konwertować tekst z obrazów na tekst w Python.

W tym artykule omówiono następujące tematy:

Konwerter tekstu na tekst w języku Python

Do konwersji tekstu z obrazów na tekst użyjemy Aspose.OCR for Python(TXT).Aspose.OCR for Python to potężna biblioteka do optycznego rozpoznawania znaków (OCR), która umożliwia programistom wyodrębnianie tekstu z obrazów i zeskanowanych dokumentów w aplikacjach Python.

Najpierw musimy zainstalować bibliotekę Aspose.OCR. Możesz łatwo pobrać pakiet lub zainstalować API z PyPI, używając następującego polecenia pip w konsoli:

pip install aspose-ocr-python-net 

Konwertuj tekst z obrazu na tekst w Python

Możemy przekonwertować tekst z obrazu i zapisać go w pliku tekstowym (TXT).Wykonaj poniższe kroki, aby programowo wyodrębnić tekst z obrazów i zapisać go jako plik tekstowy.

  1. Utwórz instancję obiektu klasy AsposeOcr.
  2. Utwórz instancję obiektu klasy OcrInput z parametrem inputType.SINGLEIMAGE.
  3. Dodaj obraz za pomocą metody add().Podobnie dodaj więcej obrazów.
  4. Następnie wywołaj metodę rozpoznawania() z obiektem OcrInput jako argumentem.
  5. Na koniec zapisz wynik jako plik tekstowy, korzystając z metody save().

Poniższy przykładowy kod pokazuje, jak przekonwertować tekst z obrazu na plik tekstowy w języku Python.

# Ten przykład kodu pokazuje, jak wyodrębnić tekst z obrazu i zapisać jako plik tekstowy w języku Python
import aspose.ocr as ocr

# Utwórz instancję API Aspose.OCR
api = ocr.AsposeOcr()

# Dodaj obraz do partii rozpoznawania
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")

# Rozpoznaj obraz
result = api.recognize(img)

# Wydrukuj wynik rozpoznania
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Tekst z konwertera obrazu na tekst w Python.

Tekst z konwertera obrazu na tekst w Python.

Tekst z obrazu na tekst – metoda zaawansowana

Podobnie możemy dodać filtry takie jak „autoskew” i ustawić opcje rozpoznawania, takie jak tryby obszaru, język itp. podczas konwersji tekstu z obrazów do plików tekstowych. Aby dodać filtry i ustawienia rozpoznawania, wykonaj poniższe czynności.

  1. Utwórz instancję obiektu klasy AsposeOcr.
  2. Zainicjuj obiekt klasy PreprocessingFilters.
  3. Dodaj filtry za pomocą metody add().
  4. Utwórz instancję obiektu klasy OcrInput za pomocą elementu inputType.SINGLEIMAGE i filtruj obiekt jako argumenty.
  5. Dodaj obraz za pomocą metody add().Podobnie dodaj więcej obrazów.
  6. Zainicjuj obiekt klasy RecognitionSettings.
  7. Określ opcje rozpoznawania.
  8. Następnie wywołaj metodę rozpoznawania() z obiektem OcrInput jako argumentem.
  9. Na koniec zapisz wynik jako plik tekstowy, korzystając z metody save().

Poniższy przykładowy kod pokazuje, jak określić filtry i ustawienia rozpoznawania na potrzeby konwertowania tekstu z obrazu na plik tekstowy w języku Python.

# Ten przykład kodu pokazuje, jak wyodrębnić tekst w języku angielskim z obrazu i zapisać jako plik tekstowy w języku Python
import aspose.ocr as ocr

# Utwórz instancję API Aspose.OCR
api = ocr.AsposeOcr()

# ustaw opcje przetwarzania wstępnego
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())

# Dodaj obraz do partii rozpoznawania
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")

# Ustaw opcje rozpoznawania
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG

# Rozpoznać
result = api.recognize(img, settings)

# Wydrukuj wynik rozpoznania
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);

Biblioteka Python OCR — uzyskaj bezpłatną licencję

Odwiedź naszą stronę „Licencja tymczasowa”, aby dowiedzieć się, jak łatwo uzyskać bezpłatną licencję i odblokować nieograniczony dostęp do biblioteki OCR języka Python. Zacznij konwertować tekst z obrazów na pliki tekstowe już dziś!

Konwerter tekstu na tekst obrazu – bezpłatne zasoby

Przejrzyj poniższe zasoby, aby dowiedzieć się więcej o funkcjach i możliwościach biblioteki:

Wniosek

W tym poście na blogu pokazaliśmy, jak używać Aspose.OCR for Python do konwersji tekstu z obrazów na pliki TXT. Wykonując kroki opisane powyżej, możesz łatwo zintegrować funkcję OCR z aplikacjami w języku Python, umożliwiając wyodrębnianie i przetwarzanie tekstu z różnych typów obrazów. Niezależnie od tego, czy pracujesz nad digitalizacją dokumentów, ekstrakcją danych, czy jakimkolwiek innym zadaniem związanym z OCR, Aspose.OCR zapewnia niezawodne i wydajne rozwiązanie. Miłego kodowania!

W przypadku jakichkolwiek niejasności prosimy o kontakt na naszym bezpłatnym forum pomocy technicznej.

Zobacz też