Proveďte OCR pomocí Java

Technologie Optical Character Recognition(OCR) umožnila rozpoznat a přečíst text v naskenovaných dokumentech a obrázcích. OCR umožňuje převést text pouze pro čtení do upravitelné formy. Převedený text lze dále zpracovat pro operace, jako je analýza textu. V tomto článku vám ukážu, jak provádět OCR na obrázcích (PNG, JPG, BMP a GIF) a jak převádět obrázky na text pomocí Java OCR API - Aspose.OCR for Java.

Tip: Možná vás bude zajímat bezplatný Text to GIF Converter, který umožňuje generovat animace z textů.

Java OCR API - Instalace

Aspose.OCR for Java lze stáhnout jako JAR nebo nainstalovat v rámci aplikace založené na Maven pomocí následujících konfigurací.

úložiště:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Závislost:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Převést obrázek na text pomocí Java

Nejčastěji jsou obrázky pro OCR stránky naskenovaných dokumentů, faktur, účtenek, účtů atd., kde je text složen z více řádků. V takových scénářích musíte z obrázku načíst celý text. Následují kroky k provedení OCR na obrázku s více řádky textu pomocí Aspose.OCR for Java.

Následující ukázka kódu ukazuje, jak provést OCR na obrázku a převést obrázek na text pomocí Java.

// Úplné příklady a datové soubory najdete na https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Cesta k adresáři dokumentů.
String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class);

// Cesta obrazu
String imagePath = dataDir + "p3.png";

//Vytvořte instanci API
AsposeOCR api = new AsposeOCR();

// Rozpoznejte stránku podle úplné cesty k souboru
try {
	String result = api.RecognizePage(imagePath);
	System.out.println("Result: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Převeďte obrázky s jedním řádkem textu

V předchozím příkladu jsme provedli OCR na obrázku s více řádky textu. Může však nastat případ, kdy obrázek obsahuje jeden řádek textu. V takovém případě můžete odpovídajícím způsobem nakonfigurovat API. Následují kroky pro převod obrázku s jedním řádkem textu.

Následující ukázka kódu ukazuje, jak provést OCR na obrázku s jedním řádkem textu pomocí Java.

// Úplné příklady a datové soubory najdete na https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Cesta k adresáři dokumentů.
String dataDir = Utils.getSharedDataDir(RecognizeLine.class);

// Cesta obrazu
String imagePath = dataDir + "0001460985.Jpeg";

//Vytvořte instanci API
AsposeOCR api = new AsposeOCR();

try {
	String result = api.RecognizeLine(imagePath);
	System.out.println("File: " + imagePath);
	System.out.println("Result line: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Závěr

V tomto článku jste viděli, jak převést obrázky PNG, JPG, BMP a GIF na text pomocí Java OCR API. Ukázky kódu ukazují, jak provádět OCR na obrázcích s jedním nebo více řádky textu v aplikacích Java. Více o Java OCR API Aspose se můžete dozvědět pomocí dokumentace.

Viz také