OCR-Bild zu Text und Rechtschreibkorrektur in C#

Wir können OCR auf Bildern oder gescannten Dokumenten durchführen und Textdaten programmgesteuert mit C# extrahieren. Wir können dann eine Rechtschreibprüfung ausführen, um Rechtschreibfehler im erkannten Text zu korrigieren. In diesem Artikel erfahren Sie, wie Sie in C# eine OCR-Bild-zu-Text- und Rechtschreibkorrektur durchführen.

Folgende Themen sollen in diesem Artikel behandelt werden:

  1. OCR-Bild zu Text und Rechtschreibkorrektur C# API
  2. OCR-Bild in Text umwandeln und Rechtschreibfehler erkennen
  3. Bild mit Rechtschreibkorrektur in Text konvertieren
  4. Erkannten Text mit korrigierter Rechtschreibung speichern
  5. Benutzerdefinierter Rechtschreibprüfungstext

OCR-Bild zu Text und Rechtschreibkorrektur C#-API

Wir werden die API Aspose.OCR for .NET verwenden, um OCR für Bilder, Textextraktion und Rechtschreibkorrektur durchzuführen. Es kann gescannte Bilder, Smartphone-Fotos, Screenshots, Bildbereiche und gescannte PDFs erkennen. Es gibt erkannte Textergebnisse in den gängigsten Dokumenten- und Datenaustauschformaten zurück. Die API ermöglicht auch das Konvertieren von Bildern in Text und das Erstellen durchsuchbarer PDFs aus Scans. Darüber hinaus ermöglicht es die automatische Korrektur von Rechtschreibfehlern im erkannten Text.

Die Klasse AsposeOcr ist die Haupt-API für die Aspose OCR-Bibliothek. Es bietet verschiedene Methoden zur Durchführung von OCR-Operationen. Die Methode RecognizeImage() dieser Klasse erkennt Text auf Bildern in den unterstützten Formaten. Die Methode CorrectSpelling() der API ersetzt falsch geschriebene Wörter durch korrekte Wörter im Text. Die Klasse RecognitionResult repräsentiert die Ergebnisse der Bilderkennung. Die Methode Save(string, SaveFormat, bool, SpellCheckLanguage, string) dieser Klasse speichert das Dokument als einfachen Text, PDF oder Microsoft Word-Dokument. Alle unterstützten Sprachen für die Rechtschreibprüfung sind in der Aufzählung SpellCheckLanguage definiert.

Bitte entweder die DLL der API herunterladen oder sie mit NuGet installieren.

PM> Install-Package Aspose.OCR

OCR-Bild in Text umwandeln und Rechtschreibfehler in C# erkennen

Wir können OCR für Bilder durchführen und eine Liste der Rechtschreibfehler im erkannten Text erhalten, indem wir die folgenden Schritte ausführen:

  1. Erstellen Sie zunächst eine Instanz der AsposeOcr-Klasse.
  2. Initialisieren Sie als Nächstes ein Objekt der RecognitionSettings-Klasse.
  3. Rufen Sie dann RecognitionResult ab, indem Sie die Methode RecognizeImage() aufrufen. Es verwendet den Bildpfad und das RecognitionSettings-Objekt als Argumente.
  4. Rufen Sie danach die Methode GetSpellCheckErrorList() auf, um eine Liste der falsch geschriebenen Wörter mit Vorschlägen zu erhalten.
  5. Schließlich durchlaufen Sie die SpellCheckError-Liste und zeigen die Ergebnisse an.

Der folgende Beispielcode zeigt, wie Sie eine Liste mit Rechtschreibfehlern aus einem erkannten Text in C# abrufen.

// Dieses Codebeispiel zeigt, wie Sie eine Liste mit falsch geschriebenen Wörtern aus erkanntem Text abrufen.
// Pfad zum zu erkennenden Bild
string imagePath = @"C:\Files\OCR\sample.png";

// OCR-API erstellen
AsposeOcr api = new AsposeOcr();

// Erkennungseinstellungen initialisieren
RecognitionSettings settings = new RecognitionSettings();

// Bild erkennen           
RecognitionResult result = api.RecognizeImage(imagePath, settings);

// Holen Sie sich eine Liste der falsch geschriebenen Wörter mit Vorschlägen
List<SpellCheckError> errorsList = result.GetSpellCheckErrorList(SpellCheckLanguage.Eng);

foreach (var word in errorsList)
{
    Console.WriteLine($"Misspelled Word - {word.Word}");
    foreach (var suggest in word.SuggestedWords)
    {
        Console.WriteLine($"Suggested word - {suggest.Word}");
    }

    Console.WriteLine();
}
OCR-Bild in Text umwandeln und Rechtschreibfehler in C# erkennen

Rufen Sie eine Liste mit Rechtschreibfehlern in C# ab

Konvertieren von Bildern in Text mit Rechtschreibkorrektur in C#

Wir können ein Bild in Text umwandeln und Rechtschreibfehler automatisch korrigieren, indem wir die folgenden Schritte ausführen:

  1. Erstellen Sie zunächst eine Instanz der AsposeOcr-Klasse.
  2. Initialisieren Sie als Nächstes ein Objekt der RecognitionSettings-Klasse.
  3. Rufen Sie dann RecognitionResult ab, indem Sie die Methode RecognizeImage() aufrufen. Es verwendet den Bildpfad und das RecognitionSettings-Objekt als Argumente.
  4. Rufen Sie danach die Methode GetSpellCheckCorrectedText() auf, um Text mit Rechtschreibkorrektur zu erhalten.
  5. Zeigen Sie abschließend die Ergebnisse.

Der folgende Beispielcode zeigt, wie Rechtschreibfehler in einem erkannten Text in C# automatisch korrigiert werden.

// Dieses Codebeispiel zeigt, wie Rechtschreibfehler in einem erkannten Text automatisch korrigiert werden.
// Pfad zum zu erkennenden Bild
string imagePath = @"C:\Files\OCR\sample.png";

// OCR-API erstellen
AsposeOcr api = new AsposeOcr();

// Erkennungseinstellungen initialisieren
RecognitionSettings settings = new RecognitionSettings();

// Text aus einem Bild erkennen    
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Korrigiertes Ergebnis erhalten
string correctedResult = result.GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Zeige Ergebnisse
Console.WriteLine(correctedResult);
Konvertieren von Bildern in Text mit Rechtschreibkorrektur in C#

Konvertieren von Bildern in Text mit Rechtschreibkorrektur in C#

Erkannten Text mit korrigierter Rechtschreibung in C# speichern

Wir können den erkannten Text aus einem Bild nach der Rechtschreibkorrektur speichern, indem wir die folgenden Schritte ausführen:

  1. Erstellen Sie zunächst eine Instanz der AsposeOcr-Klasse.
  2. Initialisieren Sie als Nächstes ein Objekt der RecognitionSettings-Klasse.
  3. Rufen Sie danach RecognitionResult ab, indem Sie die Methode RecognizeImage() aufrufen. Es verwendet den Bildpfad und das RecognitionSettings-Objekt als Argumente.
  4. Rufen Sie schließlich die Methode Save(string, SaveFormat, bool, SpellCheckLanguage) auf, um den Text zu speichern. Der boolesche Wert von applySpellingCorrection wird als wahr angenommen.

Der folgende Beispielcode zeigt, wie der Text mit Rechtschreibkorrektur in C# gespeichert wird.

// Dieses Codebeispiel zeigt, wie der erkannte Text mit Rechtschreibkorrektur gespeichert wird.
// Pfad zum zu erkennenden Bild
string imagePath = @"C:\Files\OCR\sample.png";
string resultPath = @"C:\Files\OCR\MyResult.txt";

// OCR-API erstellen
AsposeOcr api = new AsposeOcr();

// Erkennungseinstellungen initialisieren
RecognitionSettings settings = new RecognitionSettings();
         
// Text aus einem Bild erkennen 
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Speichern Sie den korrigierten Text
result.Save(resultPath, SaveFormat.Text, true, SpellCheckLanguage.Eng);

Rechtschreibprüfungstext in C#

Wir können auch eine Rechtschreibprüfung für einen benutzerdefinierten Text durchführen, indem Sie die folgenden Schritte ausführen:

  1. Erstellen Sie zunächst eine Instanz der AsposeOcr-Klasse.
  2. Rufen Sie als Nächstes die Methode CorrectSpelling() auf. Es braucht den zu korrigierenden Text und die SpellCheckLanguage als Argumente.
  3. Zeigen Sie abschließend die Ergebnisse.

Der folgende Beispielcode zeigt die Rechtschreibprüfung von benutzerdefiniertem Text in C#.

// Dieses Codebeispiel zeigt, wie die Rechtschreibprüfung für benutzerdefinierte Textzeichenfolgen ausgeführt wird.
// Text zur Rechtschreibprüfung
string textToCorrect = "This is sample text wth errrors";

// OCR-API erstellen
AsposeOcr api = new AsposeOcr();

// Führen Sie die Rechtschreibprüfung aus, um Fehler zu korrigieren
string correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Zeige Ergebnisse
Console.WriteLine(correctedText);
This is sample text with errors

Holen Sie sich eine kostenlose Evaluierungslizenz

Sie können eine kostenlose temporäre Lizenz erhalten, um Aspose.OCR für .NET ohne Evaluierungseinschränkungen zu testen.

Fazit

In diesem Artikel haben wir gelernt, wie man:

  • OCR durchführen und Text auf Bildern in C# erkennen;
  • erhalten Sie eine Liste der falsch geschriebenen Wörter zusammen mit korrekten Wortvorschlägen;
  • Rechtschreibfehler automatisch korrigieren;
  • Speichern Sie den korrigierten Text programmgesteuert.

Außerdem können Sie mithilfe der Dokumentation mehr über Aspose.OCR für die .NET-API erfahren. Bei Unklarheiten können Sie uns gerne in unserem Forum kontaktieren.

Siehe auch