Naskenované PDF do Excelu OCR Java

Naskenované soubory PDF obsahují data v obrazovém formátu, protože je často vytvářejí skenery. V určitých situacích můžete vyžadovat číselné informace z naskenovaného souboru PDF. Můžete tedy provádět operace OCR pro vytvoření souboru aplikace Excel. Tento článek popisuje, jak vytvořit naskenovaný převodník PDF do Excelu s funkcí OCR programově v Javě.

Vytvořte naskenovaný převodník PDF do Excelu s OCR – instalace Java API

Text v souboru PDF můžete opticky rozpoznat pomocí funkce OCR pomocí Aspose.OCR for Java API. Jednoduše nainstalujte API stažením souboru JAR ze sekce New Releases nebo pomocí níže uvedených specifikací Maven:

úložiště:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Závislost:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

Převeďte naskenované PDF do Excelu programově v Javě

Naskenovaný soubor PDF můžete převést do Excelu pomocí OCR podle následujících kroků:

  1. Vytvořte objekt třídy AsposeOcr.
  2. Zadejte nastavení pomocí třídy DocumentRecognitionSettings.
  3. Rozpoznejte naskenovaný soubor PDF pomocí metody RecognizePdf.
  4. Uložte výstupní výsledek OCR jako soubor aplikace Excel.

Následující úryvek kódu vysvětluje, jak převést naskenovaný PDF na soubor Excel programově v Javě:

// Cesta k naskenovanému souboru PDF
String fullPath = "scanned.pdf";

// Inicializujte objekt třídy AsposeOcr
AsposeOCRPdf api = new AsposeOCRPdf();

// Inicializujte objekt třídy DocumentRecognitionSettings
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// Rozpoznejte obrázky z PDF           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// Uložte výsledek jako soubor Excel XLSX
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);

Získejte bezplatnou zkušební licenci

Rozhraní API pro vytváření naskenovaného převodníku PDF do Excelu pomocí operací OCR můžete bez jakýchkoli omezení vyhodnotit, když si vyžádáte bezplatnou dočasnou licenci.

Závěr

V tomto článku jste pochopili, jak převést naskenovaný soubor PDF na soubor aplikace Excel s funkcí OCR programově v Javě. Kromě toho se podívejte na další funkce související s OCR návštěvou dokumentace. V případě jakýchkoliv obav nám neváhejte napsat na fórum.

Viz také