Text z obrázku do textu v Pythonu | Obrázek Python Text na text

Převod textu z obrázků do upravitelných formátů je zásadní úkol pro různé aplikace. Ať už pracujete s naskenovanými dokumenty, vizitkami nebo ručně psanými poznámkami, extrahování textu z obrázků může výrazně ušetřit čas a zvýšit produktivitu. V tomto příspěvku na blogu se naučíme, jak převést text z obrázků na text v Pythonu.

Tento článek se zabývá následujícími tématy:

Python Image Converter textu na text

Pro převod textu z obrázků na text použijeme Aspose.OCR for Python(TXT).Aspose.OCR for Python je výkonná knihovna pro optické rozpoznávání znaků (OCR), která umožňuje vývojářům extrahovat text z obrázků a naskenovaných dokumentů v aplikacích Pythonu.

Nejprve musíme nainstalovat knihovnu Aspose.OCR. Můžete snadno stáhnout balíček nebo nainstalovat API z PyPI pomocí následujícího příkazu pip v konzole:

pip install aspose-ocr-python-net 

Převod textu z obrázku na text v Pythonu

Můžeme převést text z obrázku a uložit jej do textového (TXT) souboru. Chcete-li programově extrahovat text z obrázků a uložit jej jako textový soubor, postupujte podle níže uvedených kroků.

  1. Vytvořte instanci objektu třídy AsposeOcr.
  2. Vytvořte instanci objektu třídy OcrInput s argumentem InputType.SINGLEIMAGE.
  3. Přidejte obrázek pomocí metody add().Podobně přidejte další obrázky.
  4. Poté zavolejte metodu rozpoznat() s objektem OcrInput jako argumentem.
  5. Nakonec výsledek uložte jako textový soubor pomocí metody save().

Následující ukázka kódu ukazuje, jak převést text z obrázku do textového souboru v Pythonu.

# Tento příklad kódu ukazuje, jak extrahovat text z obrázku a uložit jako textový soubor v Pythonu
import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# Přidejte obrázek do dávky rozpoznávání
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")

# Rozpoznejte obrázek
result = api.recognize(img)

# Výsledek rozpoznání tisku
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Převaděč textu z obrázku na text v Pythonu.

Převaděč textu z obrázku na text v Pythonu.

Text z obrázku do textu – pokročilá metoda

Podobně můžeme při převodu textu z obrázků do textových souborů přidat filtry jako „autoskew“ a nastavit možnosti rozpoznávání, jako jsou oblastní režimy, jazyk atd. Chcete-li přidat filtry a nastavení rozpoznávání, postupujte podle následujících kroků.

  1. Vytvořte instanci objektu třídy AsposeOcr.
  2. Inicializujte objekt třídy PreprocessingFilters.
  3. Přidejte filtry pomocí metody add().
  4. Vytvořte instanci objektu třídy OcrInput pomocí InputType.SINGLEIMAGE a filtruje objekt jako argumenty.
  5. Přidejte obrázek pomocí metody add().Podobně přidejte další obrázky.
  6. Inicializujte objekt třídy RecognitionSettings.
  7. Zadejte možnosti rozpoznávání.
  8. Poté zavolejte metodu rozpoznat() s objektem OcrInput jako argumentem.
  9. Nakonec výsledek uložte jako textový soubor pomocí metody save().

Následující ukázka kódu ukazuje, jak určit filtry a nastavení rozpoznávání pro převod textu z obrázku na textový soubor v Pythonu.

# Tento příklad kódu ukazuje, jak extrahovat anglický text z obrázku a uložit jako textový soubor v Pythonu
import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# nastavit možnosti předběžného zpracování
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())

# Přidejte obrázek do dávky rozpoznávání
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")

# Nastavte možnosti rozpoznávání
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG

# Uznat
result = api.recognize(img, settings)

# Výsledek rozpoznání tisku
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);

Knihovna Python OCR – Získejte bezplatnou licenci

Navštivte naši stránku „Dočasná licence“, kde se dozvíte, jak snadno získat bezplatnou licenci a odemknout neomezený přístup ke knihovně Python OCR. Začněte převádět text z obrázků na textové soubory ještě dnes!

Převodník textu na text z obrázku – bezplatné zdroje

Prozkoumejte níže uvedené zdroje a zjistěte více o funkcích a možnostech knihovny:

Závěr

V tomto příspěvku na blogu jsme ukázali, jak používat Aspose.OCR for Python k převodu textu z obrázků do souborů TXT. Podle výše uvedených kroků můžete snadno integrovat funkce OCR do svých aplikací Python, což vám umožní extrahovat a zpracovávat text z různých typů obrázků. Ať už pracujete na digitalizaci dokumentů, extrakci dat nebo na jakémkoli jiném úkolu souvisejícím s OCR, Aspose.OCR poskytuje spolehlivé a efektivní řešení. Šťastné kódování!

V případě jakýchkoliv nejasností nás prosím neváhejte kontaktovat na našem bezplatném fóru podpory.

Viz také