Skannade PDF-filer innehåller data i bildformat eftersom de ofta skapas av skannrar. I vissa situationer kan du behöva numerisk information från en skannad PDF-fil. Så du kan utföra OCR-operationer för att skapa en Excel-fil. Den här artikeln tar upp hur man skapar en skannad PDF till Excel-konverterare med OCR-funktion programmatiskt i Java.
- Skapa Scanned PDF to Excel Converter med OCR – Java API-installation
- Konvertera skannad PDF till Excel Programmatiskt i Java
Skapa Scanned PDF to Excel Converter med OCR – Java API-installation
Du kan optiskt känna igen texten i en PDF-fil med OCR-funktionen med Aspose.OCR for Java API. Installera helt enkelt API:et genom att ladda ner JAR-filen från avsnittet New Releases eller använda Maven-specifikationerna nedan:
Förvar:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
Beroende:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>21.12</version>
</dependency>
Konvertera skannad PDF till Excel Programmatiskt i Java
Du kan konvertera en skannad PDF-fil till Excel med OCR genom att följa stegen nedan:
- Skapa ett klassobjekt AsposeOcr.
- Ange inställningarna med klassen DocumentRecognitionSettings.
- Känn igen den skannade PDF-filen med metoden RecognizePdf.
- Spara OCR-resultat som en Excel-fil.
Följande kodavsnitt beskriver hur man konverterar en skannad PDF till en Excel-fil programmatiskt i Java:
// Sökväg till skannad PDF-fil
String fullPath = "scanned.pdf";
// Initiera AsposeOcr-klassobjektet
AsposeOCRPdf api = new AsposeOCRPdf();
// Initiera klassobjektet DocumentRecognitionSettings
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);
// Känn igen bilder från PDF
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);
// Spara resultatet som Excel XLSX-fil
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);
Få gratis utvärderingslicens
Du kan utvärdera API:et för att skapa skannad PDF till Excel-konverterare med OCR-operationer utan några begränsningar genom att begära en gratis temporär licens.
Slutsats
I den här artikeln har du förstått hur du konverterar en skannad PDF-fil till en Excel-fil med OCR-funktionen programmatiskt i Java. Ta dessutom en titt på andra OCR-relaterade funktioner genom att besöka dokumentationen. Skriv gärna till oss på forumet om du har några problem.