PDF-filer är ibland baserade på bilder som vanligtvis skapas med en skanner eller bildbehandlingsenhet. Du kan konvertera en skannad PDF-fil till en sökbar PDF-fil med OCR så att texten kan redigeras eller uppdateras i dokumentet. I enlighet med det scenariot förklarar den här artikeln hur man konverterar en skannad PDF till en sökbar PDF med OCR-operationer programmatiskt med C#.
- Skannad PDF till sökbar PDF med OCR – C# API-installation
- Konvertera skannad PDF till sökbar PDF Programmatiskt i C#
Skannad PDF till sökbar PDF med OCR – C# API-installation
Du kan utföra OCR-operationer på en skannad PDF-fil med Aspose.OCR for .NET API. Konfigurera helt enkelt API:et genom att ladda ner DLL-filen från avsnittet New Releases eller använda följande NuGet-installationskommando:
PM> Install-Package Aspose.OCR
Konvertera skannad PDF till sökbar PDF Programmatiskt med C#
Du kan konvertera en skannad PDF-fil till ett sökbart PDF-dokument samtidigt som du känner igen texten optiskt genom att följa stegen nedan:
- Initiera klassinstansen AsposeOcr.
- Känn igen bilder från PDF med metoden RecognizePdf.
- Ställ in olika egenskaper för OCR-igenkänning med klassen DocumentRecognitionSettings.
- Spara OCR-resultat som en sökbar PDF-fil.
Kodavsnittet nedan förklarar hur man konverterar en skannad PDF till ett sökbart PDF-dokument programmatiskt med C#:
// Skannad flersidig PDF-sökväg
string fullPath = "multi_page.pdf";
// Initiera AsposeOcr-klassobjektet
AsposeOcr api = new AsposeOcr();
// Känn igen bilder från PDF
List<RecognitionResult> res = api.RecognizePdf(fullPath, new DocumentRecognitionSettings
{
StartPage = 0,
PagesNumber = 1
});
// Spara resultatet som sökbar PDF
AsposeOcr.SaveMultipageDocument("output.pdf", SaveFormat.Pdf, res);
Få gratis utvärderingslicens
Du kan utvärdera funktionen för att känna igen text i skannad PDF med OCR-operationer utan några begränsningar genom att begära en gratis tillfällig licens.
Slutsats
I den här artikeln har du lärt dig hur du konverterar en skannad PDF-fil till ett sökbart PDF-dokument genom att utföra OCR-operationer på den programmatiskt i C#. Dessutom kan du kontrollera flera andra OCR-relaterade funktioner som erbjuds av API:t genom att besöka dokumentationen. Kontakta oss gärna på forumet vid eventuella frågor.