Konwersja tekstu z obrazów na formaty edytowalne jest kluczowym zadaniem dla różnych aplikacji. Niezależnie od tego, czy pracujesz ze zeskanowanymi dokumentami, wizytówkami czy odręcznymi notatkami, wyodrębnianie tekstu z obrazów może znacznie zaoszczędzić czas i zwiększyć produktywność. W tym poście na blogu dowiemy się, jak konwertować tekst z obrazów na tekst w Python.
W tym artykule omówiono następujące tematy:
- Konwerter tekstu na tekst w języku Python
- Konwertuj tekst z obrazu na tekst w Python
- Tekst z obrazu na tekst – metoda zaawansowana
- Darmowe zasoby
- Zdobądź bezpłatną licencję
Konwerter tekstu na tekst w języku Python
Do konwersji tekstu z obrazów na tekst użyjemy Aspose.OCR for Python(TXT).Aspose.OCR for Python to potężna biblioteka do optycznego rozpoznawania znaków (OCR), która umożliwia programistom wyodrębnianie tekstu z obrazów i zeskanowanych dokumentów w aplikacjach Python.
Najpierw musimy zainstalować bibliotekę Aspose.OCR. Możesz łatwo pobrać pakiet lub zainstalować API z PyPI, używając następującego polecenia pip w konsoli:
pip install aspose-ocr-python-net
Konwertuj tekst z obrazu na tekst w Python
Możemy przekonwertować tekst z obrazu i zapisać go w pliku tekstowym (TXT).Wykonaj poniższe kroki, aby programowo wyodrębnić tekst z obrazów i zapisać go jako plik tekstowy.
- Utwórz instancję obiektu klasy AsposeOcr.
- Utwórz instancję obiektu klasy OcrInput z parametrem inputType.SINGLEIMAGE.
- Dodaj obraz za pomocą metody add().Podobnie dodaj więcej obrazów.
- Następnie wywołaj metodę rozpoznawania() z obiektem OcrInput jako argumentem.
- Na koniec zapisz wynik jako plik tekstowy, korzystając z metody save().
Poniższy przykładowy kod pokazuje, jak przekonwertować tekst z obrazu na plik tekstowy w języku Python.
# Ten przykład kodu pokazuje, jak wyodrębnić tekst z obrazu i zapisać jako plik tekstowy w języku Python
import aspose.ocr as ocr
# Utwórz instancję API Aspose.OCR
api = ocr.AsposeOcr()
# Dodaj obraz do partii rozpoznawania
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")
# Rozpoznaj obraz
result = api.recognize(img)
# Wydrukuj wynik rozpoznania
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Tekst z obrazu na tekst – metoda zaawansowana
Podobnie możemy dodać filtry takie jak „autoskew” i ustawić opcje rozpoznawania, takie jak tryby obszaru, język itp. podczas konwersji tekstu z obrazów do plików tekstowych. Aby dodać filtry i ustawienia rozpoznawania, wykonaj poniższe czynności.
- Utwórz instancję obiektu klasy AsposeOcr.
- Zainicjuj obiekt klasy PreprocessingFilters.
- Dodaj filtry za pomocą metody add().
- Utwórz instancję obiektu klasy OcrInput za pomocą elementu inputType.SINGLEIMAGE i filtruj obiekt jako argumenty.
- Dodaj obraz za pomocą metody add().Podobnie dodaj więcej obrazów.
- Zainicjuj obiekt klasy RecognitionSettings.
- Określ opcje rozpoznawania.
- Następnie wywołaj metodę rozpoznawania() z obiektem OcrInput jako argumentem.
- Na koniec zapisz wynik jako plik tekstowy, korzystając z metody save().
Poniższy przykładowy kod pokazuje, jak określić filtry i ustawienia rozpoznawania na potrzeby konwertowania tekstu z obrazu na plik tekstowy w języku Python.
# Ten przykład kodu pokazuje, jak wyodrębnić tekst w języku angielskim z obrazu i zapisać jako plik tekstowy w języku Python
import aspose.ocr as ocr
# Utwórz instancję API Aspose.OCR
api = ocr.AsposeOcr()
# ustaw opcje przetwarzania wstępnego
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())
# Dodaj obraz do partii rozpoznawania
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")
# Ustaw opcje rozpoznawania
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG
# Rozpoznać
result = api.recognize(img, settings)
# Wydrukuj wynik rozpoznania
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);
Biblioteka Python OCR — uzyskaj bezpłatną licencję
Odwiedź naszą stronę „Licencja tymczasowa”, aby dowiedzieć się, jak łatwo uzyskać bezpłatną licencję i odblokować nieograniczony dostęp do biblioteki OCR języka Python. Zacznij konwertować tekst z obrazów na pliki tekstowe już dziś!
Konwerter tekstu na tekst obrazu – bezpłatne zasoby
Przejrzyj poniższe zasoby, aby dowiedzieć się więcej o funkcjach i możliwościach biblioteki:
- Przewodnik programisty: Dive into the detailed documentation to learn about advanced features and customization options.
- Darmowe aplikacje internetowe: Experience working applications live!
- Poradniki i artykuły z instrukcjami: Follow step-by-step guides to explore specific use cases and examples.
- Odniesienie do API: Get detailed information on classes, methods, and parameters.
- Przykłady kodu: Check out code snippets and sample projects to inspire your next project.
Wniosek
W tym poście na blogu pokazaliśmy, jak używać Aspose.OCR for Python do konwersji tekstu z obrazów na pliki TXT. Wykonując kroki opisane powyżej, możesz łatwo zintegrować funkcję OCR z aplikacjami w języku Python, umożliwiając wyodrębnianie i przetwarzanie tekstu z różnych typów obrazów. Niezależnie od tego, czy pracujesz nad digitalizacją dokumentów, ekstrakcją danych, czy jakimkolwiek innym zadaniem związanym z OCR, Aspose.OCR zapewnia niezawodne i wydajne rozwiązanie. Miłego kodowania!
W przypadku jakichkolwiek niejasności prosimy o kontakt na naszym bezpłatnym forum pomocy technicznej.