Scansione di documenti in Java

In questo post del blog, esplorerai la scansione dei documenti in Java. Che tu stia costruendo un sistema di gestione dei documenti, un’app mobile o un’applicazione OCR (Optical Character Recognition), OMR (Optical Mark Recognition), questa guida ti fornirà le informazioni necessarie per implementare la scansione dei documenti utilizzando Java.

API di scansione dei documenti Java

La scansione di documenti in Java fornisce un modo semplice per convertire i documenti fisici in formati digitali. Offre numerosi vantaggi, tra cui una migliore gestione dei documenti, una condivisione e un’archiviazione più semplici, funzionalità di ricerca potenziate e meno ingombro di carta. La compatibilità e il supporto multipiattaforma di Java lo rendono una scelta eccellente per l’implementazione della funzionalità di scansione dei documenti.

Scansione di documenti OCR in Java

Scansione di documenti Java

L’OCR è una tecnologia che consente ai computer di riconoscere ed estrarre testo da immagini o documenti scansionati. Aspose.OCR for Java consente di incorporare la funzionalità OCR nelle applicazioni Java, semplificando l’estrazione di testo da varie fonti e l’utilizzo nei programmi.

Inoltre, ha il supporto linguistico per 27 caratteri latini e cirillici, oltre al cinese. L’API OCR è in grado di riconoscere vari tipi di input, come immagini scansionate, foto di smartphone, schermate, aree specifiche di immagini e PDF scansionati.

Di seguito è riportato un elenco di alcune importanti funzionalità di Aspose.OCR relative alla scansione dei documenti:

  • Estrazione del testo: riconoscere ed estrarre il testo da immagini, file scansionati o documenti PDF.
  • Supporto linguistico: supporta più lingue per estrarre il testo in diverse lingue, come inglese, spagnolo, francese, tedesco e altro.
  • Algoritmi OCR avanzati: utilizza algoritmi OCR avanzati per fornire un’estrazione del testo accurata e affidabile.
  • Opzioni di pre-elaborazione: applica filtri immagine, come la rimozione del rumore, la correzione dell’inclinazione, ecc. per migliorare la qualità dell’immagine in ingresso.
  • Facile integrazione: è progettato per essere facile da integrare nelle tue applicazioni Java.
  • Scansione collegamenti: riconosce le immagini fornite come collegamenti Web.
  • Scansione batch: offre vari metodi di elaborazione batch per riconoscere più immagini in una singola chiamata.
  • E molto di più…

È possibile esplorare ulteriormente le seguenti risorse per apprendere l’API di scansione dei documenti Java:

Inoltre, per creare un’applicazione per scanner di documenti con funzionalità OCR, puoi provare il seguente frammento di codice:

// Questo esempio di codice mostra come salvare il testo riconosciuto con la correzione ortografica.
// Percorso dell'immagine da riconoscere
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";

// Crea API OCR
AsposeOCR api = new AsposeOCR();

// Inizializza le impostazioni di riconoscimento
RecognitionSettings settings = new RecognitionSettings();

// Riconoscere il testo da un'immagine 
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Salva il testo corretto
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);

Scansione di documenti OMR in Java

Documento di scansione Java

L’estrazione e la raccolta di dati da moduli, sondaggi e valutazioni cartacei può essere un’attività dispendiosa in termini di tempo e soggetta a errori. Puoi semplificare il processo per estrarre le informazioni dai documenti scansionati utilizzando Aspose.OMR for Java.

Aspose.OMR for Java può essere utilizzato per creare modelli OMR personalizzati che definiscono la struttura e il layout dei fogli OMR. Allo stesso modo, contiene opzioni flessibili per l’esportazione dei dati estratti. Puoi salvare i dati in vari formati, inclusi CSV, XML, JSON e altri, rendendoli compatibili con diversi sistemi e applicazioni.

Di seguito sono riportate alcune delle caratteristiche di scansione dei documenti di Aspose.OMR for Java:

  • Riconoscimento dei segni: la capacità di rilevare e riconoscere con precisione i segni fatti sui moduli, come caselle di controllo, bolle o aree ombreggiate.
  • Creazione di modelli: crea modelli personalizzabili che definiscono la prospettiva dei moduli, incluso il posizionamento di domande, scelte di risposta e altri elementi.
  • Precisione e convalida: algoritmi e meccanismi per garantire un’elevata precisione nel rilevamento e nel riconoscimento dei segni.
  • Correzioni delle immagini scansionate: capacità di elaborare immagini ruotate e prospettiche (vista laterale).
  • E molto di più…

Inoltre, puoi visitare le seguenti risorse per ulteriori informazioni sulla scansione dei documenti in Java:

Inoltre, per creare uno scanner di documenti con funzionalità OMR utilizzando Java, è possibile utilizzare il seguente frammento di codice:

// Questo esempio di codice mostra come eseguire OMR su un'immagine ed estrarre i dati
// Percorso file modello OMR
String templatePath = "C:\\Files\\OMR\\Sheet.omr";

// Percorso del file immagine
String imagePath = "C:\\Files\\OMR\\Sheet1.png";

// Inizializza il motore OMR
OmrEngine engine = new OmrEngine();

// Ottieni un elaboratore di modelli
TemplateProcessor templateProcessor = engine.getTemplateProcessor(templatePath);

// Riconoscere l'immagine
RecognitionResult result = templateProcessor.recognizeImage(imagePath);

// Ottieni risultati in CSV
String csvResult = result.getCsv();

// Salva il file CSV
PrintWriter wr = new PrintWriter(new FileOutputStream("C:\\Files\\OMR\\Sheet1.csv"), true);
wr.println(csvResult);

Riassumendo

La scansione dei documenti in Java apre un mondo di possibilità per la creazione di applicazioni robuste che gestiscono i documenti scansionati. La digitalizzazione dei documenti non solo consente di risparmiare tempo e risorse, ma offre anche funzionalità avanzate di gestione dei documenti, aprendo la strada a un flusso di lavoro più snello ed efficiente per i tuoi progetti in Java.

Guarda anche