Skannade PDF till Excel OCR

Skannade PDF-filer innehåller data i bildformat och ibland kan du behöva information från sådana dokument. I vissa situationer kan en skannad PDF-fil innehålla numerisk information som kan behöva manipuleras i Excel. I enlighet med det kan du utföra OCR-operationer och skapa en Excel-fil. Den här artikeln tar upp hur du skapar en skannad PDF till Excel-konverterare med OCR-funktion programmatiskt med C#.

Skapa Scanned PDF till Excel Converter med OCR – C# API-installation

Du kan arbeta med OCR-funktioner som erbjuds av Aspose.OCR for .NET API. Du kan enkelt skapa en skannad PDF till Excel-konverterare med OCR genom att ladda ner DLL-filen från avsnittet New Releases eller med installationskommandot NuGet nedan:

PM> Install-Package Aspose.OCR

Konvertera skannad PDF till Excel Programmatiskt i C#

Du kan konvertera ett skannat PDF-dokument till en Excel-fil med OCR genom att följa stegen nedan:

  1. Instantiera klassobjektet AsposeOcr.
  2. Ange ett klassobjekt DocumentRecognitionSettings.
  3. Känn igen den skannade PDF-filen med metoden RecognizePdf.
  4. Spara utdata Excel-fil med metoden SaveMultipageDocument.

Följande kodexempel förklarar hur man konverterar en skannad PDF till Excel med C#:

// Sökväg till skannad PDF-fil
string path = "Scanned.pdf";

// Initiera AsposeOcr calss-objekt
AsposeOcr api = new AsposeOcr();

// Ange inställningarna för att känna igen PDF-fil
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;

// Känn igen sidor från skannade PDF-filer
List<RecognitionResult> res = api.RecognizePdf(path , settings);

// Spara resultatet som en Excel-fil i XLSX-format
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);

Få gratis utvärderingslicens

Du kan utvärdera funktionen med att konvertera skannade PDF-filer till Excel i sin fulla kapacitet genom att begära en gratis tillfällig licens.

Slutsats

I den här artikeln har du kontrollerat hur du konverterar en skannad PDF-fil till Excel genom att använda OCR-operationer för att känna igen texten optiskt. Detta kan vara användbart i scenarier som när en CSV-fil skannas av en skanner och en PDF-fil produceras. Du kan konvertera den till en Excel-fil programmatiskt med C#. Dessutom kan du ta en titt på andra OCR-relaterade funktioner som erbjuds av API:et genom att gå igenom dokumentationen. Om du har några frågor är du välkommen att kontakta oss på forumet.

Se även