Führen Sie OCR mit C# durch

Die OCR (Optical Character Recognition) ist eine bekannte und weit verbreitete Technologie zum Erkennen und Lesen von Text aus Bildern und gescannten Dokumenten. Bei der OCR-Operation werden die Zeichen auf den Bildern gescannt, erkannt und in die digitale Form umgewandelt. Der konvertierte Text kann validiert und gespeichert werden, um weitere Operationen durchzuführen. In diesem Artikel zeige ich Ihnen, wie Sie mithilfe der C# .NET-OCR Bibliothek OCR ausführen, um Bilder programmgesteuert in Text zu konvertieren. Der Rest des Artikels ist in die folgenden Abschnitte unterteilt.

C# OCR Bibliothek – kostenloser Download

Aspose.OCR for .NET ist eine leistungsstarke und schnelle OCR Bibliothek für C#, mit der Sie ganz einfach Bilder scannen und in Text umwandeln können. Es sind keine langen Codes erforderlich, um die OCR Funktionen in Ihren .NET Anwendungen zum Laufen zu bringen. Im Folgenden sind die Installationsmethoden der C# OCR Bibliothek aufgeführt.

Installieren Sie die C# .NET OCR Bibliothek über den NuGet Paket Manager

Suchen Sie einfach im NuGet Package Manager nach Aspose.OCR und installieren Sie es.

C# OCR Bibliothek

Installieren Sie die C# OCR Bibliothek über die Paket-Manager Konsole

Das Folgende ist der Befehl zum Installieren von Aspose.OCR über die Paket-Manager Konsole.

PM> Install-Package Aspose.OCR

Konvertieren Sie Bilder mithilfe der C# OCR Bibliothek in Text

Sehen wir uns an, wie OCR an einem Bild durchgeführt wird, das möglicherweise eine Seite eines gescannten Dokuments sein könnte. Im Folgenden sind die Schritte zum Ausführen dieses Vorgangs aufgeführt.

Das folgende Codebeispiel zeigt, wie Sie ein Bild mit C# in Text konvertieren.

// Vollständige Beispiele und Datendateien finden Sie unter https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Der Pfad zum Dokumentenverzeichnis.
string dataDir = RunExamples.GetDataDir_OCR();

// Initialisieren Sie eine Instanz von AsposeOcr
AsposeOcr api = new AsposeOcr();

// Bild erkennen
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");

// Zeigt den erkannten Text an
Console.WriteLine(result);

C# Führen Sie OCR auf einem Bild mit einer einzelnen Textzeile durch

Im vorherigen Beispiel haben wir OCR für das Bild durchgeführt, das mehrere Textzeilen enthielt. Es ist jedoch möglich, dass das Bild nur eine einzige Textzeile enthält. In solchen Fällen können Sie die API anweisen, nur die Zeile zu erkennen. Im Folgenden sind die Schritte zum Konvertieren eines Bilds mit einem einzeiligen Text in C# aufgeführt.

Das folgende Codebeispiel zeigt, wie OCR ausgeführt und ein Bild mit einer einzelnen Textzeile mithilfe von C# konvertiert wird.

// Vollständige Beispiele und Datendateien finden Sie unter https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Der Pfad zum Dokumentenverzeichnis.
string dataDir = RunExamples.GetDataDir_OCR();

// Initialisieren Sie eine Instanz von AsposeOcr
AsposeOcr api = new AsposeOcr();

// Bild erkennen
string result = api.RecognizeLine(dataDir + "sample_line.png");

// Zeigt den erkannten Text an
Console.WriteLine(result);

Führen Sie OCR für nicht-englische Zeichen durch

Aspose.OCR schränkt die OCR Funktionen für die englische Sprache nicht ein und Sie können auch die Zeichen anderer Sprachen erkennen. Der Erkennungsprozess und der Code bleiben unabhängig von der Sprache des Textes gleich. Das Folgende ist der Zeichensatz, der von der C# OCR Bibliothek von Aspose erkannt werden kann.

OCR für nicht-englische Zeichen

C# OCR Bibliothek – Holen Sie sich eine kostenlose Lizenz

Sie können Aspose.OCR ohne Evaluierungseinschränkungen verwenden, indem Sie eine [kostenlose temporäre Lizenz][7] anfordern.

Fazit

In diesem Artikel wurde gezeigt, wie Sie in C# OCR ausführen und Bilder programmgesteuert in Text konvertieren. Sie können die Zeichen in den Bildern erkennen, die ein oder mehrzeiligen Text enthalten. Weitere Informationen zur C# OCR Bibliothek finden Sie in der Dokumentation.

Siehe auch