Wykonaj OCR przy użyciu C#

OCR (Optical Character Recognition) to dobrze znana i szeroko stosowana technologia rozpoznawania i odczytywania tekstu z obrazów i zeskanowanych dokumentów. W operacji OCR znaki na obrazach są skanowane, rozpoznawane i konwertowane do postaci cyfrowej. Przekonwertowany tekst można zweryfikować i zapisać w celu wykonania dalszych operacji. W tym artykule pokażę, jak wykonać OCR, aby programowo przekonwertować obrazy na tekst przy użyciu biblioteki C# .NET OCR. Pozostała część artykułu jest podzielona na następujące sekcje.

Biblioteka C# OCR — bezpłatne pobieranie

Aspose.OCR for .NET to potężna i szybka biblioteka OCR dla języka C#, która umożliwia łatwe skanowanie i konwertowanie obrazów na tekst. Nie wymaga długich kodów, aby uruchomić i uruchomić funkcje OCR w aplikacjach .NET. Poniżej przedstawiono metody instalacji biblioteki C# OCR.

Zainstaluj bibliotekę C# .NET OCR za pomocą Menedżera pakietów NuGet

Po prostu wyszukaj Aspose.OCR w Menedżerze pakietów NuGet i zainstaluj go.

Biblioteka C# OCR

Zainstaluj bibliotekę C# OCR za pomocą konsoli Menedżera pakietów

Poniżej znajduje się polecenie instalacji Aspose.OCR za pośrednictwem konsoli Menedżera pakietów.

PM> Install-Package Aspose.OCR

Konwertuj obraz na tekst za pomocą biblioteki C# OCR

Zobaczmy, jak wykonać OCR na obrazie, który może być stroną zeskanowanego dokumentu. Poniżej przedstawiono kroki, aby wykonać tę operację.

Poniższy przykładowy kod pokazuje, jak przekonwertować obraz na tekst przy użyciu języka C#.

// Aby uzyskać pełne przykłady i pliki danych, przejdź do https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Ścieżka do katalogu dokumentów.
string dataDir = RunExamples.GetDataDir_OCR();

// Zainicjuj instancję AsposeOcr
AsposeOcr api = new AsposeOcr();

// Rozpoznaj obraz
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");

// Wyświetl rozpoznany tekst
Console.WriteLine(result);

C# Wykonaj OCR na obrazie z pojedynczą linią tekstu

W poprzednim przykładzie wykonaliśmy OCR na obrazie, który zawierał wiele wierszy tekstu. Jednak możliwe jest, że obraz zawiera tylko jedną linię tekstu. W takich przypadkach możesz nakazać interfejsowi API rozpoznawanie tylko linii. Poniżej przedstawiono kroki, aby wykonać konwersję obrazu zawierającego tekst w jednym wierszu w języku C#.

Poniższy przykładowy kod pokazuje, jak wykonać rozpoznawanie OCR i przekonwertować obraz zawierający pojedynczy wiersz tekstu przy użyciu języka C#.

// Aby uzyskać pełne przykłady i pliki danych, przejdź do https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// Ścieżka do katalogu dokumentów.
string dataDir = RunExamples.GetDataDir_OCR();

// Zainicjuj instancję AsposeOcr
AsposeOcr api = new AsposeOcr();

// Rozpoznaj obraz
string result = api.RecognizeLine(dataDir + "sample_line.png");

// Wyświetl rozpoznany tekst
Console.WriteLine(result);

Wykonaj OCR dla znaków innych niż angielskie

Aspose.OCR nie ogranicza funkcji OCR dla języka angielskiego i można również rozpoznawać znaki innych języków. Proces rozpoznawania i kod pozostaną takie same niezależnie od języka tekstu. Poniżej znajduje się zestaw znaków, które mogą być rozpoznawane przez bibliotekę C# OCR firmy Aspose.

OCR dla znaków innych niż angielskie

Biblioteka C# OCR — uzyskaj bezpłatną licencję

Możesz używać Aspose.OCR bez ograniczeń ewaluacyjnych, prosząc o [bezpłatną licencję tymczasową][7].

Wniosek

W tym artykule pokazano, jak programowo wykonać rozpoznawanie OCR i konwertować obrazy na tekst w języku C#. Możesz rozpoznać znaki na obrazach zawierających jeden lub wiele wierszy tekstu. Dowiedz się więcej o bibliotece C# OCR z dokumentacji.

Zobacz też