Naskenované soubory PDF obsahují data v obrazovém formátu, protože je často vytvářejí skenery. V určitých situacích můžete vyžadovat číselné informace z naskenovaného souboru PDF. Můžete tedy provádět operace OCR pro vytvoření souboru aplikace Excel. Tento článek popisuje, jak vytvořit naskenovaný převodník PDF do Excelu s funkcí OCR programově v Javě.
- Vytvořte naskenovaný převodník PDF do Excelu s OCR – instalace Java API
- Převeďte naskenované PDF do Excelu programově v Javě
Vytvořte naskenovaný převodník PDF do Excelu s OCR – instalace Java API
Text v souboru PDF můžete opticky rozpoznat pomocí funkce OCR pomocí Aspose.OCR for Java API. Jednoduše nainstalujte API stažením souboru JAR ze sekce New Releases nebo pomocí níže uvedených specifikací Maven:
úložiště:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
Závislost:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>21.12</version>
</dependency>
Převeďte naskenované PDF do Excelu programově v Javě
Naskenovaný soubor PDF můžete převést do Excelu pomocí OCR podle následujících kroků:
- Vytvořte objekt třídy AsposeOcr.
- Zadejte nastavení pomocí třídy DocumentRecognitionSettings.
- Rozpoznejte naskenovaný soubor PDF pomocí metody RecognizePdf.
- Uložte výstupní výsledek OCR jako soubor aplikace Excel.
Následující úryvek kódu vysvětluje, jak převést naskenovaný PDF na soubor Excel programově v Javě:
// Cesta k naskenovanému souboru PDF
String fullPath = "scanned.pdf";
// Inicializujte objekt třídy AsposeOcr
AsposeOCRPdf api = new AsposeOCRPdf();
// Inicializujte objekt třídy DocumentRecognitionSettings
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);
// Rozpoznejte obrázky z PDF
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);
// Uložte výsledek jako soubor Excel XLSX
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);
Získejte bezplatnou zkušební licenci
Rozhraní API pro vytváření naskenovaného převodníku PDF do Excelu pomocí operací OCR můžete bez jakýchkoli omezení vyhodnotit, když si vyžádáte bezplatnou dočasnou licenci.
Závěr
V tomto článku jste pochopili, jak převést naskenovaný soubor PDF na soubor aplikace Excel s funkcí OCR programově v Javě. Kromě toho se podívejte na další funkce související s OCR návštěvou dokumentace. V případě jakýchkoliv obav nám neváhejte napsat na fórum.