Skannade PDF till Excel OCR Java

Skannade PDF-filer innehåller data i bildformat eftersom de ofta skapas av skannrar. I vissa situationer kan du behöva numerisk information från en skannad PDF-fil. Så du kan utföra OCR-operationer för att skapa en Excel-fil. Den här artikeln tar upp hur man skapar en skannad PDF till Excel-konverterare med OCR-funktion programmatiskt i Java.

Skapa Scanned PDF to Excel Converter med OCR – Java API-installation

Du kan optiskt känna igen texten i en PDF-fil med OCR-funktionen med Aspose.OCR for Java API. Installera helt enkelt API:et genom att ladda ner JAR-filen från avsnittet New Releases eller använda Maven-specifikationerna nedan:

Förvar:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Beroende:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

Konvertera skannad PDF till Excel Programmatiskt i Java

Du kan konvertera en skannad PDF-fil till Excel med OCR genom att följa stegen nedan:

  1. Skapa ett klassobjekt AsposeOcr.
  2. Ange inställningarna med klassen DocumentRecognitionSettings.
  3. Känn igen den skannade PDF-filen med metoden RecognizePdf.
  4. Spara OCR-resultat som en Excel-fil.

Följande kodavsnitt beskriver hur man konverterar en skannad PDF till en Excel-fil programmatiskt i Java:

// Sökväg till skannad PDF-fil
String fullPath = "scanned.pdf";

// Initiera AsposeOcr-klassobjektet
AsposeOCRPdf api = new AsposeOCRPdf();

// Initiera klassobjektet DocumentRecognitionSettings
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// Känn igen bilder från PDF           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// Spara resultatet som Excel XLSX-fil
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);

Få gratis utvärderingslicens

Du kan utvärdera API:et för att skapa skannad PDF till Excel-konverterare med OCR-operationer utan några begränsningar genom att begära en gratis temporär licens.

Slutsats

I den här artikeln har du förstått hur du konverterar en skannad PDF-fil till en Excel-fil med OCR-funktionen programmatiskt i Java. Ta dessutom en titt på andra OCR-relaterade funktioner genom att besöka dokumentationen. Skriv gärna till oss på forumet om du har några problem.

Se även