Tekniken Optical Character Recognition(OCR) har gjort det möjligt att känna igen och läsa texten i de skannade dokumenten och bilderna. OCR låter dig konvertera skrivskyddad text till en redigerbar form. Den konverterade texten kan vidarebearbetas för operationer som textanalys. I den här artikeln ska jag visa dig hur du utför OCR på bilder (PNG, JPG, BMP och GIF) och konverterar bilder till text använder Java OCR API - Aspose.OCR for Java.
- Java OCR API - Installation
- Konvertera bild till text med Java
- Konvertera bilder med en rad text med Java
Tips: Du kanske är intresserad av en gratis Text to GIF Converter som låter dig generera animationer från texter.
Java OCR API - Installation
Aspose.OCR för Java kan laddas ner som en JAR eller installeras i en Maven-baserad applikation med följande konfigurationer.
Förvar:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
Beroende:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>20.5</version>
</dependency>
Konvertera bild till text med Java
Oftast är bilderna för OCR sidor av skannade dokument, fakturor, kvitton, räkningar och etc. där texten är sammansatt av flera rader. I sådana scenarier måste du hämta hela texten från bilden. Följande är stegen för att utföra OCR på bilden med flera textrader med Aspose.OCR för Java.
- Skapa en instans av klassen AsposeOcr.
- Konvertera bild till text med metoden AsposeOcr.recognizePage(String fullPath) genom att skicka bildens sökväg.
- Få den konverterade texten till ett strängobjekt.
Följande kodexempel visar hur man utför OCR på bild och konverterar bild till text med Java.
// För fullständiga exempel och datafiler, gå till https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Sökvägen till dokumentkatalogen.
String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class);
// Bildvägen
String imagePath = dataDir + "p3.png";
//Skapa api-instans
AsposeOCR api = new AsposeOCR();
// Känn igen sidan genom fullständig sökväg till fil
try {
String result = api.RecognizePage(imagePath);
System.out.println("Result: " + result);
} catch (IOException e) {
e.printStackTrace();
}
Konvertera bilder med en enda textrad
I det föregående exemplet har vi utfört OCR på en bild med flera textrader. Det kan dock finnas ett fall när bilden innehåller en enda textrad. I ett sådant fall kan du konfigurera API:et därefter. Följande är stegen för att konvertera en bild med en enda textrad.
- Skapa ett objekt av klassen AsposeOcr.
- Konvertera bild till text med metoden AsposeOcr.recognizeLine(String fullPath).
- Få resultatet till ett strängobjekt.
Följande kodexempel visar hur man utför OCR på en bild med en enda textrad med Java.
// För fullständiga exempel och datafiler, gå till https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Sökvägen till dokumentkatalogen.
String dataDir = Utils.getSharedDataDir(RecognizeLine.class);
// Bildvägen
String imagePath = dataDir + "0001460985.Jpeg";
//Skapa api-instans
AsposeOCR api = new AsposeOCR();
try {
String result = api.RecognizeLine(imagePath);
System.out.println("File: " + imagePath);
System.out.println("Result line: " + result);
} catch (IOException e) {
e.printStackTrace();
}
Slutsats
I den här artikeln har du sett hur du konverterar PNG-, JPG-, BMP- och GIF-bilder till text med Java OCR API. Kodexemplen visar hur man utför OCR på bilder med en eller flera rader text i Java-applikationer. Du kan lära dig mer om Asposes Java OCR API med dokumentation.