OCR da immagine a testo e correzione ortografica in Java

Possiamo eseguire l’OCR su immagini o documenti scansionati per riconoscere ed estrarre testo dalle immagini in modo programmatico utilizzando Java. Possiamo quindi eseguire un correttore ortografico per correggere gli errori di ortografia nel testo riconosciuto. In questo articolo impareremo come convertire un’immagine in testo con la correzione ortografica in Java.

In questo articolo verranno trattati i seguenti argomenti:

  1. Convertitore da immagine a testo Java con correzione ortografica
  2. OCR da immagine a testo e ottenere errori di ortografia
  3. Converti immagine in testo con correzione ortografica
  4. Salva immagine su testo con ortografia corretta
  5. Testo personalizzato del controllo ortografico

Convertitore da immagine a testo Java con correzione ortografica

Per convertire un’immagine in testo con correzioni ortografiche, utilizzeremo l’API Aspose.OCR for Java. Consente di eseguire l’OCR su immagini scansionate, foto di smartphone, schermate, aree di un’immagine e PDF scansionati. Ci consente di salvare i risultati di testo riconosciuti in formati di documenti popolari. L’API consente inoltre di convertire le immagini in testo e di correggere automaticamente gli errori di ortografia nel testo riconosciuto.

La classe AsposeOCR è l’API principale per eseguire operazioni OCR. Il metodo RecognizePage(String fullPath, RecognitionSettings settings) di questa classe riconosce il testo sulle immagini dei formati supportati. Il metodo CorrectSpelling(String text, SpellCheckLanguage language) dell’API sostituisce le parole errate con le parole corrette nel testo. La classe RecognitionResult rappresenta i risultati del riconoscimento delle immagini. Il metodo saveSpellCheckCorrectedText(string, Format, SpellCheckLanguage, string) di questa classe salva il documento come testo normale, PDF o Documento Microsoft Word. Tutte le lingue supportate per il controllo ortografico sono definite nell’enumerazione SpellCheckLanguage.

Si prega di scaricare il JAR dell’API o aggiungere la seguente configurazione pom.xml in un’applicazione Java basata su Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>22.6</version>
</dependency>

Immagine OCR in testo e ottenere errori di ortografia in Java

Possiamo eseguire l’OCR sulle immagini e ottenere un elenco di errori di ortografia nel testo riconosciuto seguendo i passaggi indicati di seguito:

  1. Innanzitutto, crea un’istanza della classe AsposeOCR.
  2. Inizializzare quindi un oggetto della classe RecognitionSettings.
  3. Quindi, ottieni RecognitionResult chiamando il metodo RecognizePage(). Prende il percorso dell’immagine e l’oggetto RecognitionSettings come argomenti.
  4. Successivamente, chiama il metodo getSpellCheckErrorList() per ottenere un elenco di parole errate con suggerimenti.
  5. Infine, scorrere l’elenco SpellCheckError e mostrare i risultati.

Il codice di esempio seguente mostra come ottenere un elenco di errori di ortografia da un testo riconosciuto in Java.

// Questo esempio di codice mostra come ottenere un elenco di errori di ortografia da un testo riconosciuto
String imagePath = "C:\\Files\\sample.jpg";

// Crea API OCR
AsposeOCR api = new AsposeOCR();

// Inizializza le impostazioni di riconoscimento
RecognitionSettings settings = new RecognitionSettings();

// Riconosci l'immagine           
RecognitionResult result = api.RecognizePage(imagePath, settings);

// Ottieni un elenco di parole errate con suggerimenti
List<SpellCheckError> errorsList = result.getSpellCheckErrorList(SpellCheckLanguage.Eng);

for (SpellCheckError error : errorsList)
{
    // Mostra parola
    System.out.println("Misspelled Word - " + error.word);
  
    // Mostra le parole suggerite
    for(SuggestedWord suggest : error.suggestedWords)
    {
      System.out.println("Suggested word - " + suggest.word);
    }

    System.out.println();
}
Immagine OCR in testo e ottenere errori di ortografia in Java

Ottieni un elenco di errori di ortografia in Java

Converti immagine in testo con correzione ortografica in Java

Possiamo convertire un’immagine in testo e correggere automaticamente gli errori di ortografia seguendo i passaggi indicati di seguito:

  1. Innanzitutto, crea un’istanza della classe AsposeOCR.
  2. Inizializzare quindi un oggetto della classe RecognitionSettings.
  3. Quindi, ottieni RecognitionResult chiamando il metodo RecognizePage(). Prende il percorso dell’immagine e l’oggetto RecognitionSettings come argomenti.
  4. Successivamente, chiama il metodo getSpellCheckCorrectedText() per ottenere il testo con la correzione dell’ortografia.
  5. Infine, mostra i risultati.

Il codice di esempio seguente mostra come correggere automaticamente gli errori di ortografia da un testo riconosciuto in Java.

// Questo esempio di codice mostra come correggere automaticamente gli errori di ortografia da un testo riconosciuto.
// Percorso dell'immagine da riconoscere
String imagePath = "C:\\Files\\sample.jpg";

// Crea API OCR
AsposeOCR api = new AsposeOCR();

// Inizializza le impostazioni di riconoscimento
RecognitionSettings settings = new RecognitionSettings();

// Riconoscere il testo da un'immagine    
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Ottieni il risultato corretto
String correctedResult = result.getSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Mostra i risultati
System.out.println(correctedResult);
Converti immagine in testo con correzione ortografica in Java

Converti immagine in testo con correzione ortografica in Java

Salva l’immagine in testo con l’ortografia corretta in Java

Possiamo salvare il testo riconosciuto da un’immagine dopo la correzione ortografica seguendo i passaggi indicati di seguito:

  1. Innanzitutto, crea un’istanza della classe AsposeOCR.
  2. Inizializzare quindi un oggetto della classe RecognitionSettings.
  3. Successivamente, ottieni RecognitionResult chiamando il metodo RecognizePage(). Prende il percorso dell’immagine e l’oggetto RecognitionSettings come argomenti.
  4. Infine, chiama il metodo saveSpellCheckCorrectedText() per salvare il testo.

Il codice di esempio seguente mostra come salvare il testo con la correzione ortografica in Java.

// Questo esempio di codice mostra come salvare il testo riconosciuto con la correzione ortografica.
// Percorso dell'immagine da riconoscere
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";

// Crea API OCR
AsposeOCR api = new AsposeOCR();

// Inizializza le impostazioni di riconoscimento
RecognitionSettings settings = new RecognitionSettings();

// Riconoscere il testo da un'immagine 
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Salva il testo corretto
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);

Controllo ortografico del testo in Java

Possiamo anche eseguire il controllo ortografico su un testo personalizzato seguendo i passaggi indicati di seguito:

  1. Innanzitutto, crea un’istanza della classe AsposeOCR.
  2. Quindi, chiama il metodo CorrectSplling(). Richiede il testo da correggere e SpellCheckLanguage come argomenti.
  3. Infine, mostra i risultati.

Il codice di esempio seguente mostra come eseguire il controllo ortografico del testo personalizzato in Java.

// Questo esempio di codice illustra come eseguire il controllo ortografico su una stringa di testo personalizzata.
// Testo per il controllo ortografico
String textToCorrect = "This is sample text wth errrors";

// Crea API OCR
AsposeOCR api = new AsposeOCR();

// Eseguire il controllo ortografico per correggere gli errori
String correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Mostra i risultati
System.out.println(correctedText);
This is sample text with errors

Get a Free Evaluation License

Puoi ottenere una licenza temporanea gratuita per provare Aspose.OCR per Java senza limitazioni di valutazione.

Conclusion

In questo articolo abbiamo imparato a:

  • eseguire l’OCR e riconoscere il testo sulle immagini;
  • convertire le immagini in testo;
  • ottenere un elenco delle parole errate insieme ai suggerimenti di parole corrette;
  • errori di ortografia della correzione automatica;
  • salvare il testo corretto utilizzando Java.

Oltre a convertire un’immagine in testo con correzioni ortografiche, puoi saperne di più su Aspose.OCR per l’API Java utilizzando la documentazione. In caso di ambiguità, non esitare a contattarci sul nostro forum di supporto gratuito.

See Also