PDF scansionato in Excel OCR Java

I file PDF scansionati comprendono dati in formato immagine perché sono spesso creati da scanner. In determinate situazioni, potrebbero essere necessarie informazioni numeriche da un file PDF scansionato. Quindi puoi eseguire operazioni OCR per creare un file Excel. Questo articolo illustra come creare un convertitore da PDF a Excel scansionato con funzionalità OCR a livello di codice in Java.

Crea un convertitore da PDF scansionato a Excel con OCR - Installazione API Java

È possibile riconoscere otticamente il testo in un file PDF con la funzione OCR utilizzando l’API Aspose.OCR for Java. Installa semplicemente l’API scaricando il file JAR dalla sezione Nuove versioni o utilizzando le specifiche Maven di seguito:

Archivio:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Dipendenza:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

Converti PDF scansionato in Excel in modo programmatico in Java

È possibile convertire un file PDF scansionato in Excel con OCR seguendo i passaggi seguenti:

  1. Crea un oggetto di classe AsposeOcr.
  2. Specificare le impostazioni con la classe DocumentRecognitionSettings.
  3. Riconosci il file PDF scansionato usando il metodo RecognizePdf.
  4. Salva il risultato dell’OCR di output come file Excel.

Il seguente frammento di codice elabora come convertire un PDF scansionato in un file Excel a livello di codice in Java:

// Percorso del file PDF scansionato
String fullPath = "scanned.pdf";

// Inizializza l'oggetto della classe AsposeOcr
AsposeOCRPdf api = new AsposeOCRPdf();

// Inizializza l'oggetto della classe DocumentRecognitionSettings
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// Riconosci le immagini da PDF           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// Salva il risultato come file XLSX di Excel
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);

Ottieni la licenza di valutazione gratuita

Puoi valutare l’API per la creazione di convertitori da PDF a Excel scansionati mediante operazioni OCR senza alcuna limitazione richiedendo una licenza temporanea gratuita.

Conclusione

In questo articolo, hai capito come convertire un file PDF scansionato in un file Excel con la funzione OCR in modo programmatico in Java. Inoltre, dai un’occhiata ad altre funzionalità relative all’OCR visitando la documentazione. Non esitare a scriverci sul forum in caso di dubbi.

Guarda anche