OCR Obraz do tekstu i korekta pisowni w C#

Możemy wykonać OCR na obrazach lub zeskanowanych dokumentach i programowo wyodrębnić dane tekstowe za pomocą C#. Następnie możemy uruchomić moduł sprawdzania pisowni, aby poprawić błędy pisowni w rozpoznanym tekście. W tym artykule dowiemy się, jak wykonać OCR obraz do tekstu i poprawić pisownię w języku C#.

W tym artykule zostaną omówione następujące tematy:

  1. OCR do tekstu i poprawiania pisowni C# API
  2. OCR obrazu do tekstu i uzyskać błędy ortograficzne
  3. Konwertuj obraz na tekst z korektą pisowni
  4. Zapisz rozpoznany tekst z poprawioną pisownią
  5. Niestandardowy tekst sprawdzania pisowni

OCR Obraz do tekstu i korekta pisowni C# API

Będziemy używać API Aspose.OCR for .NET do wykonywania OCR na obrazach, wyodrębniania tekstu i poprawiania pisowni. Może rozpoznawać zeskanowane obrazy, zdjęcia ze smartfona, zrzuty ekranu, obszary obrazów i zeskanowane pliki PDF. Zwraca rozpoznane wyniki tekstowe w najpopularniejszych formatach wymiany dokumentów i danych. Interfejs API umożliwia także konwertowanie obrazów na tekst i tworzenie przeszukiwalnych plików PDF ze skanów. Ponadto umożliwia autokorektę błędów ortograficznych w rozpoznawanym tekście.

Klasa AsposeOcr jest głównym API dla biblioteki Aspose OCR. Zapewnia różne metody wykonywania operacji OCR. Metoda RecognizeImage() tej klasy rozpoznaje tekst na obrazach w obsługiwanych formatach. Metoda CorrectSpelling() interfejsu API zastępuje błędne słowa poprawnymi słowami w tekście. Klasa RecognitionResult reprezentuje wyniki rozpoznawania obrazu. Metoda Save(string, SaveFormat, bool, SpellCheckLanguage, string) tej klasy zapisuje dokument jako zwykły tekst, PDF lub Microsoft Word Document. Wszystkie obsługiwane języki do sprawdzania pisowni są zdefiniowane w wyliczeniu SpellCheckLanguage.

Pobierz bibliotekę DLL interfejsu API lub zainstaluj ją za pomocą NuGet.

PM> Install-Package Aspose.OCR

Obraz OCR na tekst i błędy ortograficzne w języku C#

Możemy wykonać OCR na obrazach i uzyskać listę błędów ortograficznych w rozpoznanym tekście, wykonując czynności podane poniżej:

  1. Najpierw utwórz instancję klasy AsposeOcr.
  2. Następnie zainicjuj obiekt klasy RecognitionSettings.
  3. Następnie pobierz RecognitionResult, wywołując metodę RecognizeImage(). Pobiera ścieżkę obrazu i obiekt RecognitionSettings jako argumenty.
  4. Następnie wywołaj metodę GetSpellCheckErrorList(), aby uzyskać listę błędnie napisanych słów wraz z sugestiami.
  5. Na koniec przejrzyj listę SpellCheckError i pokaż wyniki.

Poniższy przykładowy kod pokazuje, jak uzyskać listę błędów pisowni z rozpoznanego tekstu w języku C#.

// Ten przykład kodu demonstruje, jak uzyskać listę błędnie napisanych wyrazów z rozpoznanego tekstu.
// Ścieżka do obrazu do rozpoznania
string imagePath = @"C:\Files\OCR\sample.png";

// Utwórz API OCR
AsposeOcr api = new AsposeOcr();

// Zainicjuj ustawienia rozpoznawania
RecognitionSettings settings = new RecognitionSettings();

// Rozpoznaj obraz           
RecognitionResult result = api.RecognizeImage(imagePath, settings);

// Uzyskaj listę błędnie napisanych słów z sugestiami
List<SpellCheckError> errorsList = result.GetSpellCheckErrorList(SpellCheckLanguage.Eng);

foreach (var word in errorsList)
{
    Console.WriteLine($"Misspelled Word - {word.Word}");
    foreach (var suggest in word.SuggestedWords)
    {
        Console.WriteLine($"Suggested word - {suggest.Word}");
    }

    Console.WriteLine();
}
Obraz OCR do tekstu i błędy ortograficzne w C#

Uzyskaj listę błędów ortograficznych w języku C#

Konwertuj obraz na tekst z korektą pisowni w C#

Możemy przekonwertować obraz na tekst i automatycznie poprawić błędy ortograficzne, wykonując poniższe czynności:

  1. Najpierw utwórz instancję klasy AsposeOcr.
  2. Następnie zainicjuj obiekt klasy RecognitionSettings.
  3. Następnie pobierz RecognitionResult, wywołując metodę RecognizeImage(). Pobiera ścieżkę obrazu i obiekt RecognitionSettings jako argumenty.
  4. Następnie wywołaj metodę GetSpellCheckCorrectedText(), aby uzyskać tekst z poprawką pisowni.
  5. Na koniec pokaż wyniki.

Poniższy przykładowy kod pokazuje, jak automatycznie poprawiać błędy pisowni z rozpoznanego tekstu w języku C#.

// Ten przykład kodu pokazuje, jak automatycznie poprawiać błędy pisowni z rozpoznanego tekstu.
// Ścieżka do obrazu do rozpoznania
string imagePath = @"C:\Files\OCR\sample.png";

// Utwórz API OCR
AsposeOcr api = new AsposeOcr();

// Zainicjuj ustawienia rozpoznawania
RecognitionSettings settings = new RecognitionSettings();

// Rozpoznaj tekst z obrazu    
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Uzyskaj poprawiony wynik
string correctedResult = result.GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Pokaż wyniki
Console.WriteLine(correctedResult);
Konwertuj obraz na tekst z korektą pisowni w C#

Konwertuj obraz na tekst z korektą pisowni w C#

Zapisz rozpoznany tekst z poprawioną pisownią w C#

Możemy zapisać rozpoznany tekst z obrazu po poprawieniu pisowni, wykonując następujące czynności:

  1. Najpierw utwórz instancję klasy AsposeOcr.
  2. Następnie zainicjuj obiekt klasy RecognitionSettings.
  3. Następnie uzyskaj RecognitionResult, wywołując metodę RecognizeImage(). Pobiera ścieżkę obrazu i obiekt RecognitionSettings jako argumenty.
  4. Na koniec wywołaj metodę Save(string, SaveFormat, bool, SpellCheckLanguage), aby zapisać tekst. Przyjmuje wartość bool applySpellingCorrection jako true.

Poniższy przykładowy kod pokazuje, jak zapisać tekst z korektą pisowni w języku C#.

// Ten przykład kodu pokazuje, jak zapisać rozpoznany tekst z korektą pisowni.
// Ścieżka do obrazu do rozpoznania
string imagePath = @"C:\Files\OCR\sample.png";
string resultPath = @"C:\Files\OCR\MyResult.txt";

// Utwórz API OCR
AsposeOcr api = new AsposeOcr();

// Zainicjuj ustawienia rozpoznawania
RecognitionSettings settings = new RecognitionSettings();
         
// Rozpoznaj tekst z obrazu 
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Zapisz poprawiony tekst
result.Save(resultPath, SaveFormat.Text, true, SpellCheckLanguage.Eng);

Sprawdź pisownię tekstu w C#

Możemy również uruchomić sprawdzanie pisowni w niestandardowym tekście, wykonując czynności podane poniżej:

  1. Najpierw utwórz instancję klasy AsposeOcr.
  2. Następnie wywołaj metodę CorrectSpelling(). Poprawia tekst i SpellCheckLanguage jako argumenty.
  3. Na koniec pokaż wyniki.

Poniższy przykładowy kod pokazuje, jak sprawdzać pisownię niestandardowego tekstu w języku C#.

// Ten przykład kodu demonstruje, jak uruchomić sprawdzanie pisowni w niestandardowym ciągu tekstowym.
// Tekst do sprawdzania pisowni
string textToCorrect = "This is sample text wth errrors";

// Utwórz API OCR
AsposeOcr api = new AsposeOcr();

// Uruchom sprawdzanie pisowni, aby poprawić błędy
string correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Pokaż wyniki
Console.WriteLine(correctedText);
This is sample text with errors

Uzyskaj bezpłatną licencję ewaluacyjną

Możesz uzyskać bezpłatną tymczasową licencję, aby wypróbować Aspose.OCR for .NET bez ograniczeń ewaluacyjnych.

Wniosek

W tym artykule dowiedzieliśmy się, jak:

  • wykonaj OCR i rozpoznaj tekst na obrazie w C#;
  • uzyskać listę błędnie napisanych słów wraz z sugestiami poprawnych słów;
  • autokorekta błędów ortograficznych;
  • programowo zapisz poprawiony tekst.

Poza tym możesz dowiedzieć się więcej o Aspose.OCR for .NET API korzystając z dokumentacji. W przypadku jakichkolwiek niejasności prosimy o kontakt na naszym forum.

Zobacz też