Skannade PDF-filer innehåller data i bildformat och ibland kan du behöva information från sådana dokument. I vissa situationer kan en skannad PDF-fil innehålla numerisk information som kan behöva manipuleras i Excel. I enlighet med det kan du utföra OCR-operationer och skapa en Excel-fil. Den här artikeln tar upp hur du skapar en skannad PDF till Excel-konverterare med OCR-funktion programmatiskt med C#.
- Skapa skannad PDF till Excel-konverterare med OCR – C# API-installation
- Konvertera skannad PDF till Excel Programmatiskt i C#
Skapa Scanned PDF till Excel Converter med OCR – C# API-installation
Du kan arbeta med OCR-funktioner som erbjuds av Aspose.OCR for .NET API. Du kan enkelt skapa en skannad PDF till Excel-konverterare med OCR genom att ladda ner DLL-filen från avsnittet New Releases eller med installationskommandot NuGet nedan:
PM> Install-Package Aspose.OCR
Konvertera skannad PDF till Excel Programmatiskt i C#
Du kan konvertera ett skannat PDF-dokument till en Excel-fil med OCR genom att följa stegen nedan:
- Instantiera klassobjektet AsposeOcr.
- Ange ett klassobjekt DocumentRecognitionSettings.
- Känn igen den skannade PDF-filen med metoden RecognizePdf.
- Spara utdata Excel-fil med metoden SaveMultipageDocument.
Följande kodexempel förklarar hur man konverterar en skannad PDF till Excel med C#:
// Sökväg till skannad PDF-fil
string path = "Scanned.pdf";
// Initiera AsposeOcr calss-objekt
AsposeOcr api = new AsposeOcr();
// Ange inställningarna för att känna igen PDF-fil
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;
// Känn igen sidor från skannade PDF-filer
List<RecognitionResult> res = api.RecognizePdf(path , settings);
// Spara resultatet som en Excel-fil i XLSX-format
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);
Få gratis utvärderingslicens
Du kan utvärdera funktionen med att konvertera skannade PDF-filer till Excel i sin fulla kapacitet genom att begära en gratis tillfällig licens.
Slutsats
I den här artikeln har du kontrollerat hur du konverterar en skannad PDF-fil till Excel genom att använda OCR-operationer för att känna igen texten optiskt. Detta kan vara användbart i scenarier som när en CSV-fil skannas av en skanner och en PDF-fil produceras. Du kan konvertera den till en Excel-fil programmatiskt med C#. Dessutom kan du ta en titt på andra OCR-relaterade funktioner som erbjuds av API:et genom att gå igenom dokumentationen. Om du har några frågor är du välkommen att kontakta oss på forumet.