Převod textu z obrázků do upravitelných formátů je zásadní úkol pro různé aplikace. Ať už pracujete s naskenovanými dokumenty, vizitkami nebo ručně psanými poznámkami, extrahování textu z obrázků může výrazně ušetřit čas a zvýšit produktivitu. V tomto příspěvku na blogu se naučíme, jak převést text z obrázků na text v Pythonu.
Tento článek se zabývá následujícími tématy:
- Python Image Converter textu na text
- Převod textu z obrázku na text v Pythonu
- Text z obrázku do textu – pokročilá metoda
- Volné zdroje
- Získejte bezplatnou licenci
Python Image Converter textu na text
Pro převod textu z obrázků na text použijeme Aspose.OCR for Python(TXT).Aspose.OCR for Python je výkonná knihovna pro optické rozpoznávání znaků (OCR), která umožňuje vývojářům extrahovat text z obrázků a naskenovaných dokumentů v aplikacích Pythonu.
Nejprve musíme nainstalovat knihovnu Aspose.OCR. Můžete snadno stáhnout balíček nebo nainstalovat API z PyPI pomocí následujícího příkazu pip v konzole:
pip install aspose-ocr-python-net
Převod textu z obrázku na text v Pythonu
Můžeme převést text z obrázku a uložit jej do textového (TXT) souboru. Chcete-li programově extrahovat text z obrázků a uložit jej jako textový soubor, postupujte podle níže uvedených kroků.
- Vytvořte instanci objektu třídy AsposeOcr.
- Vytvořte instanci objektu třídy OcrInput s argumentem InputType.SINGLEIMAGE.
- Přidejte obrázek pomocí metody add().Podobně přidejte další obrázky.
- Poté zavolejte metodu rozpoznat() s objektem OcrInput jako argumentem.
- Nakonec výsledek uložte jako textový soubor pomocí metody save().
Následující ukázka kódu ukazuje, jak převést text z obrázku do textového souboru v Pythonu.
# Tento příklad kódu ukazuje, jak extrahovat text z obrázku a uložit jako textový soubor v Pythonu
import aspose.ocr as ocr
# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()
# Přidejte obrázek do dávky rozpoznávání
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")
# Rozpoznejte obrázek
result = api.recognize(img)
# Výsledek rozpoznání tisku
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Text z obrázku do textu – pokročilá metoda
Podobně můžeme při převodu textu z obrázků do textových souborů přidat filtry jako „autoskew“ a nastavit možnosti rozpoznávání, jako jsou oblastní režimy, jazyk atd. Chcete-li přidat filtry a nastavení rozpoznávání, postupujte podle následujících kroků.
- Vytvořte instanci objektu třídy AsposeOcr.
- Inicializujte objekt třídy PreprocessingFilters.
- Přidejte filtry pomocí metody add().
- Vytvořte instanci objektu třídy OcrInput pomocí InputType.SINGLEIMAGE a filtruje objekt jako argumenty.
- Přidejte obrázek pomocí metody add().Podobně přidejte další obrázky.
- Inicializujte objekt třídy RecognitionSettings.
- Zadejte možnosti rozpoznávání.
- Poté zavolejte metodu rozpoznat() s objektem OcrInput jako argumentem.
- Nakonec výsledek uložte jako textový soubor pomocí metody save().
Následující ukázka kódu ukazuje, jak určit filtry a nastavení rozpoznávání pro převod textu z obrázku na textový soubor v Pythonu.
# Tento příklad kódu ukazuje, jak extrahovat anglický text z obrázku a uložit jako textový soubor v Pythonu
import aspose.ocr as ocr
# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()
# nastavit možnosti předběžného zpracování
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())
# Přidejte obrázek do dávky rozpoznávání
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")
# Nastavte možnosti rozpoznávání
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG
# Uznat
result = api.recognize(img, settings)
# Výsledek rozpoznání tisku
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);
Knihovna Python OCR – Získejte bezplatnou licenci
Navštivte naši stránku „Dočasná licence“, kde se dozvíte, jak snadno získat bezplatnou licenci a odemknout neomezený přístup ke knihovně Python OCR. Začněte převádět text z obrázků na textové soubory ještě dnes!
Převodník textu na text z obrázku – bezplatné zdroje
Prozkoumejte níže uvedené zdroje a zjistěte více o funkcích a možnostech knihovny:
- Průvodce vývojáře: Dive into the detailed documentation to learn about advanced features and customization options.
- Online aplikace zdarma: Experience working applications live!
- Návody a články: Follow step-by-step guides to explore specific use cases and examples.
- Odkaz na API: Get detailed information on classes, methods, and parameters.
- Příklady kódu: Check out code snippets and sample projects to inspire your next project.
Závěr
V tomto příspěvku na blogu jsme ukázali, jak používat Aspose.OCR for Python k převodu textu z obrázků do souborů TXT. Podle výše uvedených kroků můžete snadno integrovat funkce OCR do svých aplikací Python, což vám umožní extrahovat a zpracovávat text z různých typů obrázků. Ať už pracujete na digitalizaci dokumentů, extrakci dat nebo na jakémkoli jiném úkolu souvisejícím s OCR, Aspose.OCR poskytuje spolehlivé a efektivní řešení. Šťastné kódování!
V případě jakýchkoliv nejasností nás prosím neváhejte kontaktovat na našem bezplatném fóru podpory.