PDF scansionato in ricercabile con OCR in C#

I file PDF a volte sono basati su immagini che di solito vengono create utilizzando uno scanner o un dispositivo di imaging. È possibile convertire un file PDF scansionato in un file PDF ricercabile con OCR in modo che il testo possa essere modificato o aggiornato nel documento. In base a tale scenario, questo articolo spiega come convertire un PDF scansionato in un PDF ricercabile mediante operazioni OCR a livello di codice usando C#.

PDF scansionato in PDF ricercabile tramite OCR – Installazione API C#

È possibile eseguire operazioni OCR su un file PDF scansionato con l’API Aspose.OCR for .NET. Configura semplicemente l’API scaricando il file DLL dalla sezione Nuove versioni o utilizzando il comando di installazione di NuGet seguente:

PM> Install-Package Aspose.OCR

Converti PDF scansionato in PDF ricercabile a livello di codice utilizzando C#

È possibile convertire un file PDF scansionato in un documento PDF ricercabile riconoscendo otticamente il testo seguendo i passaggi seguenti:

  1. Inizializza l’istanza della classe AsposeOcr.
  2. Riconosci le immagini da PDF usando il metodo RecognizePdf.
  3. Imposta proprietà diverse per il riconoscimento OCR con la classe DocumentRecognitionSettings.
  4. Salva il risultato dell’OCR come file PDF ricercabile.

Il frammento di codice seguente spiega come convertire un PDF scansionato in un documento PDF ricercabile a livello di codice utilizzando C#:

// Percorso PDF multipagina scansionato
string fullPath = "multi_page.pdf";

// Inizializza l'oggetto della classe AsposeOcr
AsposeOcr api = new AsposeOcr();

// Riconosci le immagini da PDF           
List<RecognitionResult> res = api.RecognizePdf(fullPath, new DocumentRecognitionSettings
{
    StartPage = 0,
    PagesNumber = 1
});

// Salva il risultato come PDF ricercabile
AsposeOcr.SaveMultipageDocument("output.pdf", SaveFormat.Pdf, res);

Ottieni la licenza di valutazione gratuita

Puoi valutare la funzionalità per riconoscere il testo nel PDF scansionato con operazioni OCR senza alcuna limitazione richiedendo una licenza temporanea gratuita.

Conclusione

In questo articolo, hai imparato come convertire un file PDF scansionato in un documento PDF ricercabile eseguendo operazioni OCR su di esso a livello di codice in C#. Inoltre, puoi controllare molte altre funzionalità relative all’OCR offerte dall’API visitando la documentazione. Non esitate a contattarci al forum in caso di domande.

Guarda anche