OCR-bild till text- och stavningskorrigering i C#

Vi kan utföra OCR på bilder eller skannade dokument och extrahera textdata programmatiskt med C#. Vi kan sedan köra en stavningskontroll för att korrigera stavfel i den igenkända texten. I den här artikeln kommer vi att lära oss hur man utför OCR-bild till text- och stavningskorrigering i C#.

Följande ämnen ska behandlas i den här artikeln:

  1. OCR-bild till text- och C#-stavningskontroll-API
  2. OCR-bild till text och få stavfel
  3. Konvertera bild till text med stavningskorrigering
  4. Spara igenkänd text med korrigerad stavning
  5. Stavningskontroll anpassad text

OCR bild till text och C# stavningskontroll API

Vi kommer att använda Aspose.OCR for .NET API för att utföra OCR på bilder, textextraktion och stavningskorrigering. Den kan känna igen skannade bilder, smartphonefoton, skärmdumpar, bildområden och skannade PDF-filer. Den returnerar igenkända textresultat i de mest populära dokument- och datautbytesformaten. API:et gör det också möjligt att konvertera bilder till text och skapa sökbara PDF-filer från skanningar. Dessutom tillåter det autokorrigering av stavfel i den igenkända texten.

Klassen AsposeOcr är huvud-API:et för Aspose OCR-biblioteket. Den tillhandahåller olika metoder för att utföra OCR-operationer. Metoden RecognizeImage() för den här klassen känner igen text på bilderna i de format som stöds. Metoden CorrectSpelling() i API:t ersätter felstavade ord med korrekta ord i texten. Klassen RecognitionResult representerar resultatet av bildigenkänningen. Metoden Save(string, SaveFormat, bool, SpellCheckLanguage, string) för denna klass sparar dokumentet som vanlig text, PDF eller Microsoft Word-dokument. Alla språk som stöds för stavningskontroll är definierade i Stavningskontrollspråk uppräkning.

Vänligen antingen ladda ner API:ts DLL eller installera den med NuGet.

PM> Install-Package Aspose.OCR

OCR-bild till text och få stavfel i C#

Vi kan utföra OCR på bilder och få en lista över stavfel i den igenkända texten genom att följa stegen nedan:

  1. Skapa först en instans av klassen AsposeOcr.
  2. Initiera sedan ett objekt av klassen RecognitionSettings.
  3. Få sedan RecognitionResult genom att anropa metoden RecognizeImage(). Den tar bildsökvägen och RecognitionSettings-objektet som argument.
  4. Efter det, anropa metoden GetSpellCheckErrorList() för att få en lista över felstavade ord med förslag.
  5. Slutligen, gå igenom SpellCheckError-listan och visa resultat.

Följande exempelkod visar hur man får en lista över stavfel från en igenkänd text i C#.

// Detta kodexempel visar hur man får en lista över felstavade ord från igenkänd text.
// Sökväg till bilden att känna igen
string imagePath = @"C:\Files\OCR\sample.png";

// Skapa OCR API
AsposeOcr api = new AsposeOcr();

// Initiera igenkänningsinställningar
RecognitionSettings settings = new RecognitionSettings();

// Känner igen bilden           
RecognitionResult result = api.RecognizeImage(imagePath, settings);

// Få lista över felstavade ord med förslag
List<SpellCheckError> errorsList = result.GetSpellCheckErrorList(SpellCheckLanguage.Eng);

foreach (var word in errorsList)
{
    Console.WriteLine($"Misspelled Word - {word.Word}");
    foreach (var suggest in word.SuggestedWords)
    {
        Console.WriteLine($"Suggested word - {suggest.Word}");
    }

    Console.WriteLine();
}
OCR-bild till text och få stavfel i C#

Få en lista över stavfel i C#

Konvertera bild till text med stavningskorrigering i C#

Vi kan konvertera en bild till text och autokorrigera stavfel genom att följa stegen nedan:

  1. Skapa först en instans av klassen AsposeOcr.
  2. Initiera sedan ett objekt av klassen RecognitionSettings.
  3. Få sedan RecognitionResult genom att anropa metoden RecognizeImage(). Den tar bildsökvägen och RecognitionSettings-objektet som argument.
  4. Efter det, anropa metoden GetSpellCheckCorrectedText() för att få text med stavningskorrigering.
  5. Till sist, visa resultaten.

Följande exempelkod visar hur man autokorrigerar stavfel från en igenkänd text i C#.

// Detta kodexempel visar hur man autokorrigerar stavfel från en igenkänd text.
// Sökväg till bilden att känna igen
string imagePath = @"C:\Files\OCR\sample.png";

// Skapa OCR API
AsposeOcr api = new AsposeOcr();

// Initiera igenkänningsinställningar
RecognitionSettings settings = new RecognitionSettings();

// Känna igen text från en bild    
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Få korrigerat resultat
string correctedResult = result.GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Visa resultat
Console.WriteLine(correctedResult);
Konvertera bild till text med stavningskorrigering i C#

Konvertera bild till text med stavningskorrigering i C#

Spara igenkänd text med korrigerad stavning i C#

Vi kan spara den igenkända texten från en bild efter stavningskorrigering genom att följa stegen nedan:

  1. Skapa först en instans av klassen AsposeOcr.
  2. Initiera sedan ett objekt av klassen RecognitionSettings.
  3. Efter det, få RecognitionResult genom att anropa RecognizeImage() -metoden. Den tar bildsökvägen och RecognitionSettings-objektet som argument.
  4. Till sist, anropa metoden Save(string, SaveFormat, bool, SpellCheckLanguage) för att spara texten. Det tar boolvärdet för appliceringCorrection som sant.

Följande exempelkod visar hur man sparar texten med stavningskorrigering i C#.

// Detta kodexempel visar hur man sparar den igenkända texten med stavningskorrigering.
// Sökväg till bilden att känna igen
string imagePath = @"C:\Files\OCR\sample.png";
string resultPath = @"C:\Files\OCR\MyResult.txt";

// Skapa OCR API
AsposeOcr api = new AsposeOcr();

// Initiera igenkänningsinställningar
RecognitionSettings settings = new RecognitionSettings();
         
// Känna igen text från en bild 
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Spara den korrigerade texten
result.Save(resultPath, SaveFormat.Text, true, SpellCheckLanguage.Eng);

Stavningskontrolltext i C#

Vi kan också köra stavningskontroll på en anpassad text genom att följa stegen nedan:

  1. Skapa först en instans av klassen AsposeOcr.
  2. Anropa sedan CorrectSpelling()-metoden. Det tar texten att korrigera och SpellCheckLanguage som argument.
  3. Till sist, visa resultaten.

Följande exempelkod visar hur man stavningskontrollerar anpassad text i C#.

// Det här kodexemplet visar hur man kör stavningskontroll på en anpassad textsträng.
// Text för stavningskontroll
string textToCorrect = "This is sample text wth errrors";

// Skapa OCR API
AsposeOcr api = new AsposeOcr();

// Kör stavningskontroll för att rätta till fel
string correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Visa resultat
Console.WriteLine(correctedText);
This is sample text with errors

Skaffa en gratis utvärderingslicens

Du kan få en gratis tillfällig licens för att prova Aspose.OCR för .NET utan utvärderingsbegränsningar.

Slutsats

I den här artikeln har vi lärt oss hur man:

  • utföra OCR och känna igen text på bild i C#;
  • få en lista över de felstavade orden tillsammans med korrekta ordförslag;
  • autokorrigera stavfel;
  • spara den korrigerade texten programmatiskt.

Förutom OCR bild till text och stavningskontroll i C# kan du lära dig mer om Aspose.OCR för .NET API med hjälp av dokumentationen. I händelse av oklarheter är du välkommen att kontakta oss på vårt gratis supportforum.

Se även