Känna igen text DjVu Bild C# OCR

Formatet DjVu används för att lagra skannade dokument eftersom de kan innehålla text, bilder eller ritningar. DjVu används för att arkivera data eftersom den kan lagra data med minimalt utrymme. Den här artikeln tar upp hur man känner igen text från DjVu-bilder med OCR-operationer programmatiskt i C#.

Textigenkänning från DjVu Image – C# API-installation

Aspose.OCR for .NET API stöder optisk teckenigenkänning för olika typer av dokument som JPG, PNG, PDF, etc. På samma sätt stöder det även textigenkänning från flersidiga DjVu-bildfiler. Du kan enkelt konfigurera API:t genom att ladda ner JAR-filen för API:t från avsnittet Nedladdningar. På samma sätt kan du köra följande installationskommando NuGet för att installera biblioteket i ditt projekt:

PM> Install-Package Aspose.OCR

Känna igen text genom att utföra OCR på DjVu-bild i C#

Du kan känna igen text genom att utföra OCR-operationer på flersidiga DjVu-bilder genom att följa stegen nedan:

  1. Initiera en API-instans med klassen AsposeOCR.
  2. Skapa ett klassobjekt DocumentRecognitionSettings.
  3. Känna igen text med metoden RecognizeDjvu.
  4. Skriv ut den igenkända texten.

Följande kodexempel visar hur man känner igen text från en DjVu-bild genom att utföra OCR programmatiskt i C#:

// Mata in sökväg för DJVU-bildfil
string imgPath = "sample1.djvu";

// Initiera AsposeOcr-klassobjektet
AsposeOcr api = new AsposeOcr();

// Känn igen bilder från DJVU
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
set.PagesNumber = 0;
List<Aspose.OCR.RecognitionResult> result = api.RecognizeDjvu(imgPath, set);

// Skriv ut resultat
int pageNumber = 0;
foreach (var page in result)
{
    System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
}

Skaffa en gratis API-licens

Du kan begära en Free Temporary License för att utvärdera API:t utan några utvärderingsbegränsningar.

Slutsats

Sammanfattningsvis har du lärt dig att känna igen text med OCR-operationer på en flersidig DjVu-bild. Du kan känna igen text med möjligheten att ange inställningar för dokumentigenkänning där du kan ställa in alternativ för automatisk kontrast och snedställning för inmatningsbilden för att öka noggrannheten i textigenkänningsprocessen. Dessutom kan du utforska olika andra funktioner som stöds av API:et genom att ta en titt på avsnittet dokumentation. Om du behöver diskutera några av dina problem eller krav får du gärna skriva till oss på forumet.

Se även

Konvertera bild till Excel med OCR i C#