OCR da immagine a testo e correzione ortografica in C#

Possiamo eseguire l’OCR su immagini o documenti scansionati ed estrarre dati testuali in modo programmatico utilizzando C#. Possiamo quindi eseguire un correttore ortografico per correggere gli errori di ortografia nel testo riconosciuto. In questo articolo impareremo come eseguire l’immagine OCR in testo e la correzione ortografica in C#.

In questo articolo verranno trattati i seguenti argomenti:

  1. OCR da immagine a testo e correzione ortografica C# API
  2. OCR da immagine a testo e ottenere errori di ortografia
  3. Converti immagine in testo con correzione ortografica
  4. Salva il testo riconosciuto con l’ortografia corretta
  5. Testo personalizzato del controllo ortografico

OCR da immagine a testo e correzione ortografica C# API

Utilizzeremo l’API Aspose.OCR for .NET per eseguire l’OCR sulle immagini, l’estrazione del testo e la correzione dell’ortografia. È in grado di riconoscere immagini scansionate, foto di smartphone, schermate, aree di immagini e PDF scansionati. Restituisce risultati di testo riconosciuti nei formati di scambio di dati e documenti più diffusi. L’API consente inoltre di convertire le immagini in testo e di creare PDF ricercabili dalle scansioni. Inoltre, consente di correggere automaticamente gli errori di ortografia nel testo riconosciuto.

La classe AsposeOcr è l’API principale per la libreria Aspose OCR. Fornisce vari metodi per eseguire operazioni OCR. Il metodo RecognizeImage() di questa classe riconosce il testo sulle immagini dei formati supportati. Il metodo CorrectSpelling() dell’API sostituisce le parole errate con parole corrette nel testo. La classe RecognitionResult rappresenta i risultati del riconoscimento dell’immagine. Il metodo Save(string, SaveFormat, bool, SpellCheckLanguage, string) di questa classe salva il documento come testo normale, PDF o Documento Microsoft Word. Tutte le lingue supportate per il controllo ortografico sono definite nell’enumerazione SpellCheckLanguage.

Si prega di scaricare la DLL dell’API o installarla utilizzando NuGet.

PM> Install-Package Aspose.OCR

Immagine OCR in testo e ottenere errori di ortografia in C#

Possiamo eseguire l’OCR sulle immagini e ottenere un elenco di errori di ortografia nel testo riconosciuto seguendo i passaggi indicati di seguito:

  1. Innanzitutto, crea un’istanza della classe AsposeOcr.
  2. Inizializzare quindi un oggetto della classe RecognitionSettings.
  3. Quindi, ottieni RecognitionResult chiamando il metodo RecognizeImage(). Prende il percorso dell’immagine e l’oggetto RecognitionSettings come argomenti.
  4. Successivamente, chiama il metodo GetSpellCheckErrorList() per ottenere un elenco di parole errate con suggerimenti.
  5. Infine, scorrere l’elenco SpellCheckError e mostrare i risultati.

Il codice di esempio seguente mostra come ottenere un elenco di errori di ortografia da un testo riconosciuto in C#.

// Questo esempio di codice mostra come ottenere un elenco di parole errate dal testo riconosciuto.
// Percorso dell'immagine da riconoscere
string imagePath = @"C:\Files\OCR\sample.png";

// Crea API OCR
AsposeOcr api = new AsposeOcr();

// Inizializza le impostazioni di riconoscimento
RecognitionSettings settings = new RecognitionSettings();

// Riconosci l'immagine           
RecognitionResult result = api.RecognizeImage(imagePath, settings);

// Ottieni un elenco di parole errate con suggerimenti
List<SpellCheckError> errorsList = result.GetSpellCheckErrorList(SpellCheckLanguage.Eng);

foreach (var word in errorsList)
{
    Console.WriteLine($"Misspelled Word - {word.Word}");
    foreach (var suggest in word.SuggestedWords)
    {
        Console.WriteLine($"Suggested word - {suggest.Word}");
    }

    Console.WriteLine();
}
Immagine OCR in testo e ottenere errori di ortografia in C#

Ottieni un elenco di errori di ortografia in C#

Converti immagine in testo con correzione ortografica in C#

Possiamo convertire un’immagine in testo e correggere automaticamente gli errori di ortografia seguendo i passaggi indicati di seguito:

  1. Innanzitutto, crea un’istanza della classe AsposeOcr.
  2. Inizializzare quindi un oggetto della classe RecognitionSettings.
  3. Quindi, ottieni RecognitionResult chiamando il metodo RecognizeImage(). Prende il percorso dell’immagine e l’oggetto RecognitionSettings come argomenti.
  4. Successivamente, chiama il metodo GetSpellCheckCorrectedText() per ottenere il testo con la correzione dell’ortografia.
  5. Infine, mostra i risultati.

Il codice di esempio seguente mostra come correggere automaticamente gli errori di ortografia da un testo riconosciuto in C#.

// Questo esempio di codice mostra come correggere automaticamente gli errori di ortografia da un testo riconosciuto.
// Percorso dell'immagine da riconoscere
string imagePath = @"C:\Files\OCR\sample.png";

// Crea API OCR
AsposeOcr api = new AsposeOcr();

// Inizializza le impostazioni di riconoscimento
RecognitionSettings settings = new RecognitionSettings();

// Riconoscere il testo da un'immagine    
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Ottieni il risultato corretto
string correctedResult = result.GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Mostra i risultati
Console.WriteLine(correctedResult);
Converti immagine in testo con correzione ortografica in C#

Converti immagine in testo con correzione ortografica in C#

Salva il testo riconosciuto con l’ortografia corretta in C#

Possiamo salvare il testo riconosciuto da un’immagine dopo la correzione ortografica seguendo i passaggi indicati di seguito:

  1. Innanzitutto, crea un’istanza della classe AsposeOcr.
  2. Inizializzare quindi un oggetto della classe RecognitionSettings.
  3. Successivamente, ottieni RecognitionResult chiamando il metodo RecognizeImage(). Prende il percorso dell’immagine e l’oggetto RecognitionSettings come argomenti.
  4. Infine, chiama il metodo Save(string, SaveFormat, bool, SpellCheckLanguage) per salvare il testo. Prende il valore bool applySpllingCorrection come true.

Il codice di esempio seguente mostra come salvare il testo con la correzione ortografica in C#.

// Questo esempio di codice mostra come salvare il testo riconosciuto con la correzione ortografica.
// Percorso dell'immagine da riconoscere
string imagePath = @"C:\Files\OCR\sample.png";
string resultPath = @"C:\Files\OCR\MyResult.txt";

// Crea API OCR
AsposeOcr api = new AsposeOcr();

// Inizializza le impostazioni di riconoscimento
RecognitionSettings settings = new RecognitionSettings();
         
// Riconoscere il testo da un'immagine 
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Salva il testo corretto
result.Save(resultPath, SaveFormat.Text, true, SpellCheckLanguage.Eng);

Controllo ortografico del testo in C#

Possiamo anche eseguire il controllo ortografico su un testo personalizzato seguendo i passaggi indicati di seguito:

  1. Innanzitutto, crea un’istanza della classe AsposeOcr.
  2. Quindi, chiama il metodo CorrectSplling(). Richiede il testo da correggere e SpellCheckLanguage come argomenti.
  3. Infine, mostra i risultati.

Il codice di esempio seguente mostra come eseguire il controllo ortografico del testo personalizzato in C#.

// Questo esempio di codice illustra come eseguire il controllo ortografico su una stringa di testo personalizzata.
// Testo per il controllo ortografico
string textToCorrect = "This is sample text wth errrors";

// Crea API OCR
AsposeOcr api = new AsposeOcr();

// Eseguire il controllo ortografico per correggere gli errori
string correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Mostra i risultati
Console.WriteLine(correctedText);
This is sample text with errors

Ottieni una licenza di valutazione gratuita

Puoi ottenere una licenza temporanea gratuita per provare Aspose.OCR per .NET senza limitazioni di valutazione.

Conclusione

In questo articolo abbiamo imparato a:

  • eseguire l’OCR e riconoscere il testo sull’immagine in C#;
  • ottenere un elenco delle parole errate insieme a suggerimenti di parole corrette;
  • errori di ortografia della correzione automatica;
  • salvare il testo corretto a livello di codice.

Inoltre, puoi saperne di più su Aspose.OCR per .NET API usando la documentazione. In caso di ambiguità, non esitare a contattarci sul nostro forum.

Guarda anche