In questo post del blog, esplorerai la scansione dei documenti in Java. Che tu stia costruendo un sistema di gestione dei documenti, un’app mobile o un’applicazione OCR (Optical Character Recognition), OMR (Optical Mark Recognition), questa guida ti fornirà le informazioni necessarie per implementare la scansione dei documenti utilizzando Java.
- API di scansione dei documenti Java
- Scansione di documenti OCR in Java
- Scansione di documenti OMR in Java
API di scansione dei documenti Java
La scansione di documenti in Java fornisce un modo semplice per convertire i documenti fisici in formati digitali. Offre numerosi vantaggi, tra cui una migliore gestione dei documenti, una condivisione e un’archiviazione più semplici, funzionalità di ricerca potenziate e meno ingombro di carta. La compatibilità e il supporto multipiattaforma di Java lo rendono una scelta eccellente per l’implementazione della funzionalità di scansione dei documenti.
Scansione di documenti OCR in Java
L’OCR è una tecnologia che consente ai computer di riconoscere ed estrarre testo da immagini o documenti scansionati. Aspose.OCR for Java consente di incorporare la funzionalità OCR nelle applicazioni Java, semplificando l’estrazione di testo da varie fonti e l’utilizzo nei programmi.
Inoltre, ha il supporto linguistico per 27 caratteri latini e cirillici, oltre al cinese. L’API OCR è in grado di riconoscere vari tipi di input, come immagini scansionate, foto di smartphone, schermate, aree specifiche di immagini e PDF scansionati.
Di seguito è riportato un elenco di alcune importanti funzionalità di Aspose.OCR relative alla scansione dei documenti:
- Estrazione del testo: riconoscere ed estrarre il testo da immagini, file scansionati o documenti PDF.
- Supporto linguistico: supporta più lingue per estrarre il testo in diverse lingue, come inglese, spagnolo, francese, tedesco e altro.
- Algoritmi OCR avanzati: utilizza algoritmi OCR avanzati per fornire un’estrazione del testo accurata e affidabile.
- Opzioni di pre-elaborazione: applica filtri immagine, come la rimozione del rumore, la correzione dell’inclinazione, ecc. per migliorare la qualità dell’immagine in ingresso.
- Facile integrazione: è progettato per essere facile da integrare nelle tue applicazioni Java.
- Scansione collegamenti: riconosce le immagini fornite come collegamenti Web.
- Scansione batch: offre vari metodi di elaborazione batch per riconoscere più immagini in una singola chiamata.
- E molto di più…
È possibile esplorare ulteriormente le seguenti risorse per apprendere l’API di scansione dei documenti Java:
Inoltre, per creare un’applicazione per scanner di documenti con funzionalità OCR, puoi provare il seguente frammento di codice:
// Questo esempio di codice mostra come salvare il testo riconosciuto con la correzione ortografica.
// Percorso dell'immagine da riconoscere
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";
// Crea API OCR
AsposeOCR api = new AsposeOCR();
// Inizializza le impostazioni di riconoscimento
RecognitionSettings settings = new RecognitionSettings();
// Riconoscere il testo da un'immagine
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());
// Salva il testo corretto
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);
Scansione di documenti OMR in Java
L’estrazione e la raccolta di dati da moduli, sondaggi e valutazioni cartacei può essere un’attività dispendiosa in termini di tempo e soggetta a errori. Puoi semplificare il processo per estrarre le informazioni dai documenti scansionati utilizzando Aspose.OMR for Java.
Aspose.OMR for Java può essere utilizzato per creare modelli OMR personalizzati che definiscono la struttura e il layout dei fogli OMR. Allo stesso modo, contiene opzioni flessibili per l’esportazione dei dati estratti. Puoi salvare i dati in vari formati, inclusi CSV, XML, JSON e altri, rendendoli compatibili con diversi sistemi e applicazioni.
Di seguito sono riportate alcune delle caratteristiche di scansione dei documenti di Aspose.OMR for Java:
- Riconoscimento dei segni: la capacità di rilevare e riconoscere con precisione i segni fatti sui moduli, come caselle di controllo, bolle o aree ombreggiate.
- Creazione di modelli: crea modelli personalizzabili che definiscono la prospettiva dei moduli, incluso il posizionamento di domande, scelte di risposta e altri elementi.
- Precisione e convalida: algoritmi e meccanismi per garantire un’elevata precisione nel rilevamento e nel riconoscimento dei segni.
- Correzioni delle immagini scansionate: capacità di elaborare immagini ruotate e prospettiche (vista laterale).
- E molto di più…
Inoltre, puoi visitare le seguenti risorse per ulteriori informazioni sulla scansione dei documenti in Java:
Inoltre, per creare uno scanner di documenti con funzionalità OMR utilizzando Java, è possibile utilizzare il seguente frammento di codice:
// Questo esempio di codice mostra come eseguire OMR su un'immagine ed estrarre i dati
// Percorso file modello OMR
String templatePath = "C:\\Files\\OMR\\Sheet.omr";
// Percorso del file immagine
String imagePath = "C:\\Files\\OMR\\Sheet1.png";
// Inizializza il motore OMR
OmrEngine engine = new OmrEngine();
// Ottieni un elaboratore di modelli
TemplateProcessor templateProcessor = engine.getTemplateProcessor(templatePath);
// Riconoscere l'immagine
RecognitionResult result = templateProcessor.recognizeImage(imagePath);
// Ottieni risultati in CSV
String csvResult = result.getCsv();
// Salva il file CSV
PrintWriter wr = new PrintWriter(new FileOutputStream("C:\\Files\\OMR\\Sheet1.csv"), true);
wr.println(csvResult);
Riassumendo
La scansione dei documenti in Java apre un mondo di possibilità per la creazione di applicazioni robuste che gestiscono i documenti scansionati. La digitalizzazione dei documenti non solo consente di risparmiare tempo e risorse, ma offre anche funzionalità avanzate di gestione dei documenti, aprendo la strada a un flusso di lavoro più snello ed efficiente per i tuoi progetti in Java.