Skannad PDF till sökbar med OCR i C#

PDF-filer är ibland baserade på bilder som vanligtvis skapas med en skanner eller bildbehandlingsenhet. Du kan konvertera en skannad PDF-fil till en sökbar PDF-fil med OCR så att texten kan redigeras eller uppdateras i dokumentet. I enlighet med det scenariot förklarar den här artikeln hur man konverterar en skannad PDF till en sökbar PDF med OCR-operationer programmatiskt med C#.

Skannad PDF till sökbar PDF med OCR – C# API-installation

Du kan utföra OCR-operationer på en skannad PDF-fil med Aspose.OCR for .NET API. Konfigurera helt enkelt API:et genom att ladda ner DLL-filen från avsnittet New Releases eller använda följande NuGet-installationskommando:

PM> Install-Package Aspose.OCR

Konvertera skannad PDF till sökbar PDF Programmatiskt med C#

Du kan konvertera en skannad PDF-fil till ett sökbart PDF-dokument samtidigt som du känner igen texten optiskt genom att följa stegen nedan:

  1. Initiera klassinstansen AsposeOcr.
  2. Känn igen bilder från PDF med metoden RecognizePdf.
  3. Ställ in olika egenskaper för OCR-igenkänning med klassen DocumentRecognitionSettings.
  4. Spara OCR-resultat som en sökbar PDF-fil.

Kodavsnittet nedan förklarar hur man konverterar en skannad PDF till ett sökbart PDF-dokument programmatiskt med C#:

// Skannad flersidig PDF-sökväg
string fullPath = "multi_page.pdf";

// Initiera AsposeOcr-klassobjektet
AsposeOcr api = new AsposeOcr();

// Känn igen bilder från PDF           
List<RecognitionResult> res = api.RecognizePdf(fullPath, new DocumentRecognitionSettings
{
    StartPage = 0,
    PagesNumber = 1
});

// Spara resultatet som sökbar PDF
AsposeOcr.SaveMultipageDocument("output.pdf", SaveFormat.Pdf, res);

Få gratis utvärderingslicens

Du kan utvärdera funktionen för att känna igen text i skannad PDF med OCR-operationer utan några begränsningar genom att begära en gratis tillfällig licens.

Slutsats

I den här artikeln har du lärt dig hur du konverterar en skannad PDF-fil till ett sökbart PDF-dokument genom att utföra OCR-operationer på den programmatiskt i C#. Dessutom kan du kontrollera flera andra OCR-relaterade funktioner som erbjuds av API:t genom att besöka dokumentationen. Kontakta oss gärna på forumet vid eventuella frågor.

Se även