Eseguire l'OCR utilizzando Java

La tecnologia Riconoscimento ottico dei caratteri (OCR) ha consentito di riconoscere e leggere il testo all’interno dei documenti e delle immagini scansionati. L’OCR ti consente di convertire il testo di sola lettura in un modulo modificabile. Il testo convertito può essere ulteriormente elaborato per operazioni come l’analisi del testo. In questo articolo, ti mostrerò come eseguire l’OCR sulle immagini (PNG, JPG, BMP e GIF) e convertire le immagini in testo utilizzando l’API OCR Java - Aspose.OCR per Java.

Suggerimento: potresti essere interessato a un Convertitore da testo a GIF gratuito che ti consente di generare animazioni dai testi.

API Java OCR - Installazione

Aspose.OCR per Java può essere scaricato come JAR o installato all’interno di un’applicazione basata su Maven utilizzando le seguenti configurazioni.

Archivio:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Dipendenza:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Converti immagine in testo usando Java

Molto spesso, le immagini per l’OCR sono le pagine di documenti scansionati, fatture, ricevute, fatture e così via, in cui il testo è composto da più righe. In tali scenari, è necessario recuperare l’intero testo dall’immagine. Di seguito sono riportati i passaggi per eseguire l’OCR sull’immagine con più righe di testo utilizzando Aspose.OCR per Java.

L’esempio di codice seguente mostra come eseguire l’OCR sull’immagine e convertire l’immagine in testo utilizzando Java.

// Per esempi completi e file di dati, visitare https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Il percorso della directory dei documenti.
String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class);

// Il percorso dell'immagine
String imagePath = dataDir + "p3.png";

//Crea istanza API
AsposeOCR api = new AsposeOCR();

// Riconosci la pagina in base al percorso completo del file
try {
	String result = api.RecognizePage(imagePath);
	System.out.println("Result: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Converti immagini con una singola riga di testo

Nell’esempio precedente, abbiamo eseguito l’OCR su un’immagine con più righe di testo. Tuttavia, potrebbe verificarsi un caso in cui l’immagine contiene una singola riga di testo. In tal caso, puoi configurare l’API di conseguenza. Di seguito sono riportati i passaggi per convertire un’immagine con una singola riga di testo.

L’esempio di codice seguente mostra come eseguire l’OCR su un’immagine con una singola riga di testo utilizzando Java.

// Per esempi completi e file di dati, visitare https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Il percorso della directory dei documenti.
String dataDir = Utils.getSharedDataDir(RecognizeLine.class);

// Il percorso dell'immagine
String imagePath = dataDir + "0001460985.Jpeg";

//Crea istanza API
AsposeOCR api = new AsposeOCR();

try {
	String result = api.RecognizeLine(imagePath);
	System.out.println("File: " + imagePath);
	System.out.println("Result line: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Conclusione

In questo articolo, hai visto come convertire immagini PNG, JPG, BMP e GIF in testo utilizzando l’API OCR Java. Gli esempi di codice mostrano come eseguire l’OCR su immagini con righe di testo singole o multiple all’interno di applicazioni Java. Puoi saperne di più sull’API Java OCR di Aspose usando la documentazione.

Guarda anche