Java kullanarak OCR gerçekleştirme

Optik Karakter Tanıma (OCR) teknolojisi, taranan belgelerdeki ve görüntülerdeki metnin tanınmasını ve okunmasını mümkün kılmıştır. OCR, salt okunur metni düzenlenebilir bir forma dönüştürmenizi sağlar. Dönüştürülen metin, metin analizi gibi işlemler için daha fazla işlenebilir. Bu makalede, size görüntülerde (PNG, JPG, BMP ve GIF) OCR işlemini nasıl yapacağınızı ve görüntüleri metne dönüştürmeyi göstereceğim. Java OCR API kullanarak - Aspose.OCR for Java.

İpucu: Metinlerden animasyonlar oluşturmanıza olanak tanıyan ücretsiz bir Metinden GIF’e Dönüştürücü ilginizi çekebilir.

Java OCR API - Kurulum

Aspose.OCR for Java, JAR olarak indirilebilir veya aşağıdaki yapılandırmalar kullanılarak Maven tabanlı bir uygulama içinde kurulabilir.

Depo:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Bağımlılık:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Java kullanarak Görüntüyü Metne Dönüştür

Çoğu zaman, OCR için resimler, metnin birden çok satırdan oluştuğu taranan belgelerin, faturaların, makbuzların, senetlerin vb. sayfalarıdır. Bu tür senaryolarda, tüm metni görüntüden almanız gerekir. Aspose.OCR for Java kullanarak birden fazla metin satırına sahip görüntü üzerinde OCR gerçekleştirme adımları aşağıdadır.

Aşağıdaki kod örneği, görüntü üzerinde OCR gerçekleştirmeyi ve Java kullanarak görüntüyü metne dönüştürmeyi gösterir.

// Eksiksiz örnekler ve veri dosyaları için lütfen https://github.com/aspose-ocr/Aspose.OCR-for-Java adresine gidin.
// Belgeler dizininin yolu.
String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class);

// görüntü yolu
String imagePath = dataDir + "p3.png";

//api örneği oluştur
AsposeOCR api = new AsposeOCR();

// Sayfayı dosyanın tam yoluna göre tanı
try {
	String result = api.RecognizePage(imagePath);
	System.out.println("Result: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Tek Satır Metne Sahip Görüntüleri Dönüştür

Önceki örnekte, birden çok metin satırına sahip bir görüntüde OCR gerçekleştirdik. Ancak, görüntünün tek bir metin satırı içerdiği bir durum olabilir. Böyle bir durumda API’yi buna göre yapılandırabilirsiniz. Aşağıdakiler, tek satırlık bir metne sahip bir görüntüyü dönüştürme adımlarıdır.

Aşağıdaki kod örneği, Java kullanılarak tek satırlık bir metne sahip bir görüntüde OCR’nin nasıl gerçekleştirileceğini gösterir.

// Eksiksiz örnekler ve veri dosyaları için lütfen https://github.com/aspose-ocr/Aspose.OCR-for-Java adresine gidin.
// Belgeler dizininin yolu.
String dataDir = Utils.getSharedDataDir(RecognizeLine.class);

// görüntü yolu
String imagePath = dataDir + "0001460985.Jpeg";

//api örneği oluştur
AsposeOCR api = new AsposeOCR();

try {
	String result = api.RecognizeLine(imagePath);
	System.out.println("File: " + imagePath);
	System.out.println("Result line: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Çözüm

Bu makalede, Java OCR API kullanarak PNG, JPG, BMP ve GIF resimlerinin metne nasıl dönüştürüleceğini gördünüz. Kod örnekleri, Java uygulamalarında tek veya birden çok metin satırına sahip görüntülerde OCR’nin nasıl gerçekleştirileceğini gösterir. Aspose’un Java OCR API’si hakkında dokümantasyon kullanarak daha fazla bilgi edinebilirsiniz.

Ayrıca bakınız