Utför OCR med C#

OCR (Optical Character Recognition) är en välkänd och allmänt använd teknik för att känna igen och läsa text från bilder och skannade dokument. I OCR-operationen skannas tecknen på bilderna, kännas igen och omvandlas till digital form. Den konverterade texten kan valideras och sparas för att utföra ytterligare operationer. I den här artikeln kommer jag att visa dig hur du utför OCR för att konvertera bilder till text programmatiskt med C# .NET OCR-bibliotek. Resten av artikeln är uppdelad i följande avsnitt.

C# Image to Text Converter

Aspose.OCR for .NET är ett kraftfullt och höghastighets OCR-bibliotek för C# som låter dig skanna och konvertera bilder till text ganska enkelt. Det kräver inga långa koder för att få igång OCR-funktionerna i dina .NET-applikationer.

Vänligen ladda ner DLL för API:t eller installera den med följande NuGet-kommando:

PM> Install-Package Aspose.OCR

Konvertera bild till text med C# OCR Library

Låt oss se hur man utför OCR på en bild som möjligen kan vara en sida i ett skannat dokument. Följande är stegen för att utföra denna operation.

Följande kodexempel visar hur man konverterar en bild till text med C#.

// För fullständiga exempel och datafiler, gå till https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Sökvägen till dokumentkatalogen.
string dataDir = RunExamples.GetDataDir_OCR();

// Initiera en instans av AsposeOcr
AsposeOcr api = new AsposeOcr();

// Känner igen bilden
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");

// Visa den igenkända texten
Console.WriteLine(result);

C# Utför OCR på bild med en enda textrad

I det föregående exemplet har vi utfört OCR på bilden som innehöll flera textrader. Det är dock möjligt att bilden bara innehåller en enda textrad. I sådana fall kan du säga åt API:et att bara känna igen linjen. Följande är stegen för att utföra konvertera en bild som innehåller en enkelradstext i C#.

Följande kodexempel visar hur man utför OCR och konverterar en bild som innehåller en enda textrad med C#.

// För fullständiga exempel och datafiler, gå till https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Sökvägen till dokumentkatalogen.
string dataDir = RunExamples.GetDataDir_OCR();

// Initiera en instans av AsposeOcr
AsposeOcr api = new AsposeOcr();

// Känner igen bilden
string result = api.RecognizeLine(dataDir + "sample_line.png");

// Visa den igenkända texten
Console.WriteLine(result);

Utför OCR för icke-engelska tecken

Aspose.OCR begränsar inte OCR-funktionerna för det engelska språket och du kan känna igen tecken på andra språk också. Igenkänningsprocessen och koden kommer att förbli desamma oavsett textens språk. Följande är uppsättningen tecken som kan kännas igen av Asposes C# OCR-bibliotek.

OCR för icke-engelska tecken

C# OCR Library - Skaffa en gratis licens

Du kan använda Aspose.OCR utan utvärderingsbegränsningar genom att begära en gratis temporär licens.

C# OCR Bild till text

Förutom att utföra OCR på bilder och konvertera bilder till text, utforska olika andra funktioner i API:t med hjälp av följande resurser:

Slutsats

Den här artikeln demonstrerade hur man utför OCR och konverterar bilder till text programmatiskt i C#. Du kan känna igen tecknen i bilderna som innehåller enstaka eller flera textrader. I händelse av oklarheter är du välkommen att kontakta oss på vårt gratis supportforum.

Se även