OCR (Optical Character Recognition) je dobře známá a široce používaná technologie pro rozpoznávání a čtení textu z obrázků a naskenovaných dokumentů. Při operaci OCR jsou znaky na obrázcích naskenovány, rozpoznány a převedeny do digitální podoby. Převedený text lze ověřit a uložit pro provedení dalších operací. V tomto článku vám ukážu, jak provést OCR pro převod obrázků na text programově pomocí knihovny C# .NET OCR. Zbytek článku je rozdělen do následujících částí.
- Knihovna C# OCR - Instalace
- Převeďte obrázek na text pomocí C# OCR API
- Proveďte OCR na obrázcích s jedním řádkem textu
Knihovna C# OCR – ke stažení zdarma
Aspose.OCR for .NET je výkonná a vysokorychlostní knihovna OCR pro C#, která umožňuje poměrně snadno skenovat a převádět obrázky na text. Ke zprovoznění funkcí OCR ve vašich aplikacích .NET nevyžaduje dlouhé kódy. Níže jsou uvedeny způsoby instalace knihovny C# OCR.
Nainstalujte C# .NET OCR Library přes NuGet Package Manager
Jednoduše vyhledejte Aspose.OCR v NuGet Package Manager a nainstalujte jej.
Nainstalujte C# OCR Library přes Package Manager Console
Následuje příkaz k instalaci Aspose.OCR prostřednictvím konzoly Správce balíčků.
PM> Install-Package Aspose.OCR
Převeďte obrázek na text pomocí knihovny C# OCR
Podívejme se, jak provést OCR na obrázku, který by mohl být stránkou naskenovaného dokumentu. Následují kroky k provedení této operace.
- Vytvořte instanci třídy AsposeOcr.
- Zavolejte metodu AsposeOcr.RecognizeImage(string) předáním cesty k obrázku a přeneste výsledek do objektu typu string.
Následující ukázka kódu ukazuje, jak převést obrázek na text pomocí C#.
// Úplné příklady a datové soubory najdete na https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Cesta k adresáři dokumentů.
string dataDir = RunExamples.GetDataDir_OCR();
// Inicializujte instanci AsposeOcr
AsposeOcr api = new AsposeOcr();
// Rozpoznat obrázek
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");
// Zobrazte rozpoznaný text
Console.WriteLine(result);
C# Provádějte OCR na obrázku s jedním řádkem textu
V předchozím příkladu jsme provedli OCR na obrázku, který obsahoval více řádků textu. Je však možné, že obrázek obsahuje pouze jeden řádek textu. V takových případech můžete říct API, aby rozpoznalo pouze linku. Následují kroky k provedení převodu obrázku obsahujícího jednořádkový text v C#.
- Vytvořte objekt třídy AsposeOcr.
- Zavolejte metodu AsposeOcr.RecognizeLine(string) a předejte jí cestu k souboru obrázku.
- Získat výsledek do objektu typu string.
Následující ukázka kódu ukazuje, jak provést OCR a převést obrázek obsahující jeden řádek textu pomocí C#.
// Úplné příklady a datové soubory najdete na https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Cesta k adresáři dokumentů.
string dataDir = RunExamples.GetDataDir_OCR();
// Inicializujte instanci AsposeOcr
AsposeOcr api = new AsposeOcr();
// Rozpoznat obrázek
string result = api.RecognizeLine(dataDir + "sample_line.png");
// Zobrazte rozpoznaný text
Console.WriteLine(result);
Proveďte OCR pro neanglické znaky
Aspose.OCR neomezuje funkce OCR pro anglický jazyk a můžete rozpoznat i znaky jiných jazyků. Proces rozpoznávání a kód zůstanou stejné bez ohledu na jazyk textu. Následuje sada znaků, které lze rozpoznat knihovnou C# OCR Aspose.
Knihovna C# OCR – Získejte bezplatnou licenci
Aspose.OCR můžete používat bez omezení hodnocení tím, že požádáte o [bezplatnou dočasnou licenci][7].
Závěr
Tento článek demonstroval, jak provádět OCR a převádět obrázky na text programově v C#. Můžete rozpoznat znaky na obrázcích obsahujících jeden nebo více řádků textu. Další informace o knihovně C# OCR naleznete v dokumentaci.