Utför OCR med Java

Tekniken Optical Character Recognition(OCR) har gjort det möjligt att känna igen och läsa texten i de skannade dokumenten och bilderna. OCR låter dig konvertera skrivskyddad text till en redigerbar form. Den konverterade texten kan vidarebearbetas för operationer som textanalys. I den här artikeln ska jag visa dig hur du utför OCR på bilder (PNG, JPG, BMP och GIF) och konverterar bilder till text använder Java OCR API - Aspose.OCR for Java.

Tips: Du kanske är intresserad av en gratis Text to GIF Converter som låter dig generera animationer från texter.

Java OCR API - Installation

Aspose.OCR för Java kan laddas ner som en JAR eller installeras i en Maven-baserad applikation med följande konfigurationer.

Förvar:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Beroende:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Konvertera bild till text med Java

Oftast är bilderna för OCR sidor av skannade dokument, fakturor, kvitton, räkningar och etc. där texten är sammansatt av flera rader. I sådana scenarier måste du hämta hela texten från bilden. Följande är stegen för att utföra OCR på bilden med flera textrader med Aspose.OCR för Java.

Följande kodexempel visar hur man utför OCR på bild och konverterar bild till text med Java.

// För fullständiga exempel och datafiler, gå till https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Sökvägen till dokumentkatalogen.
String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class);

// Bildvägen
String imagePath = dataDir + "p3.png";

//Skapa api-instans
AsposeOCR api = new AsposeOCR();

// Känn igen sidan genom fullständig sökväg till fil
try {
	String result = api.RecognizePage(imagePath);
	System.out.println("Result: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Konvertera bilder med en enda textrad

I det föregående exemplet har vi utfört OCR på en bild med flera textrader. Det kan dock finnas ett fall när bilden innehåller en enda textrad. I ett sådant fall kan du konfigurera API:et därefter. Följande är stegen för att konvertera en bild med en enda textrad.

Följande kodexempel visar hur man utför OCR på en bild med en enda textrad med Java.

// För fullständiga exempel och datafiler, gå till https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Sökvägen till dokumentkatalogen.
String dataDir = Utils.getSharedDataDir(RecognizeLine.class);

// Bildvägen
String imagePath = dataDir + "0001460985.Jpeg";

//Skapa api-instans
AsposeOCR api = new AsposeOCR();

try {
	String result = api.RecognizeLine(imagePath);
	System.out.println("File: " + imagePath);
	System.out.println("Result line: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Slutsats

I den här artikeln har du sett hur du konverterar PNG-, JPG-, BMP- och GIF-bilder till text med Java OCR API. Kodexemplen visar hur man utför OCR på bilder med en eller flera rader text i Java-applikationer. Du kan lära dig mer om Asposes Java OCR API med dokumentation.

Se även