Proveďte OCR pomocí C#

OCR (Optical Character Recognition) je dobře známá a široce používaná technologie pro rozpoznávání a čtení textu z obrázků a naskenovaných dokumentů. Při operaci OCR jsou znaky na obrázcích naskenovány, rozpoznány a převedeny do digitální podoby. Převedený text lze ověřit a uložit pro provedení dalších operací. V tomto článku vám ukážu, jak provést OCR pro převod obrázků na text programově pomocí knihovny C# .NET OCR. Zbytek článku je rozdělen do následujících částí.

Knihovna C# OCR – ke stažení zdarma

Aspose.OCR for .NET je výkonná a vysokorychlostní knihovna OCR pro C#, která umožňuje poměrně snadno skenovat a převádět obrázky na text. Ke zprovoznění funkcí OCR ve vašich aplikacích .NET nevyžaduje dlouhé kódy. Níže jsou uvedeny způsoby instalace knihovny C# OCR.

Nainstalujte C# .NET OCR Library přes NuGet Package Manager

Jednoduše vyhledejte Aspose.OCR v NuGet Package Manager a nainstalujte jej.

Knihovna C# OCR

Nainstalujte C# OCR Library přes Package Manager Console

Následuje příkaz k instalaci Aspose.OCR prostřednictvím konzoly Správce balíčků.

PM> Install-Package Aspose.OCR

Převeďte obrázek na text pomocí knihovny C# OCR

Podívejme se, jak provést OCR na obrázku, který by mohl být stránkou naskenovaného dokumentu. Následují kroky k provedení této operace.

Následující ukázka kódu ukazuje, jak převést obrázek na text pomocí C#.

// Úplné příklady a datové soubory najdete na https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Cesta k adresáři dokumentů.
string dataDir = RunExamples.GetDataDir_OCR();

// Inicializujte instanci AsposeOcr
AsposeOcr api = new AsposeOcr();

// Rozpoznat obrázek
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");

// Zobrazte rozpoznaný text
Console.WriteLine(result);

C# Provádějte OCR na obrázku s jedním řádkem textu

V předchozím příkladu jsme provedli OCR na obrázku, který obsahoval více řádků textu. Je však možné, že obrázek obsahuje pouze jeden řádek textu. V takových případech můžete říct API, aby rozpoznalo pouze linku. Následují kroky k provedení převodu obrázku obsahujícího jednořádkový text v C#.

Následující ukázka kódu ukazuje, jak provést OCR a převést obrázek obsahující jeden řádek textu pomocí C#.

// Úplné příklady a datové soubory najdete na https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Cesta k adresáři dokumentů.
string dataDir = RunExamples.GetDataDir_OCR();

// Inicializujte instanci AsposeOcr
AsposeOcr api = new AsposeOcr();

// Rozpoznat obrázek
string result = api.RecognizeLine(dataDir + "sample_line.png");

// Zobrazte rozpoznaný text
Console.WriteLine(result);

Proveďte OCR pro neanglické znaky

Aspose.OCR neomezuje funkce OCR pro anglický jazyk a můžete rozpoznat i znaky jiných jazyků. Proces rozpoznávání a kód zůstanou stejné bez ohledu na jazyk textu. Následuje sada znaků, které lze rozpoznat knihovnou C# OCR Aspose.

OCR pro neanglické znaky

Knihovna C# OCR – Získejte bezplatnou licenci

Aspose.OCR můžete používat bez omezení hodnocení tím, že požádáte o [bezplatnou dočasnou licenci][7].

Závěr

Tento článek demonstroval, jak provádět OCR a převádět obrázky na text programově v C#. Můžete rozpoznat znaky na obrázcích obsahujících jeden nebo více řádků textu. Další informace o knihovně C# OCR naleznete v dokumentaci.

Viz také