Lakukan OCR menggunakan Java

Teknologi Pengenalan Karakter Optik (OCR) telah memungkinkan untuk mengenali dan membaca teks dalam dokumen dan gambar yang dipindai. OCR memungkinkan Anda mengonversi teks hanya-baca menjadi bentuk yang dapat diedit. Teks yang dikonversi selanjutnya dapat diproses untuk operasi seperti analisis teks. Pada artikel ini, saya akan menunjukkan cara melakukan OCR pada gambar (PNG, JPG, BMP, dan GIF) dan mengonversi gambar menjadi teks menggunakan Java OCR API - Aspose.OCR for Java.

Tip: Anda mungkin tertarik dengan Text to GIF Converter gratis yang memungkinkan Anda membuat animasi dari teks.

Java OCR API - Instalasi

Aspose.OCR for Java dapat diunduh sebagai JAR atau diinstal dalam aplikasi berbasis Maven menggunakan konfigurasi berikut.

Gudang:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Ketergantungan:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Konversi Gambar ke Teks menggunakan Java

Paling sering, gambar untuk OCR adalah halaman dokumen yang dipindai, faktur, kwitansi, tagihan, dll. Di mana teks terdiri dari beberapa baris. Dalam skenario seperti itu, Anda perlu mengambil seluruh teks dari gambar. Berikut adalah langkah-langkah untuk melakukan OCR pada gambar yang memiliki banyak baris teks menggunakan Aspose.OCR for Java.

Contoh kode berikut menunjukkan cara melakukan OCR pada gambar dan mengonversi gambar menjadi teks menggunakan Java.

// Untuk contoh lengkap dan file data, silakan buka https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Path ke direktori dokumen.
String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class);

// Jalur gambar
String imagePath = dataDir + "p3.png";

//Buat instance api
AsposeOCR api = new AsposeOCR();

// Kenali halaman dengan path lengkap ke file
try {
	String result = api.RecognizePage(imagePath);
	System.out.println("Result: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Konversi Gambar yang memiliki Satu Baris Teks

Pada contoh sebelumnya, kami telah melakukan OCR pada gambar yang memiliki banyak baris teks. Namun, mungkin ada kasus ketika gambar berisi satu baris teks. Untuk kasus seperti itu, Anda dapat mengonfigurasi API yang sesuai. Berikut ini adalah langkah-langkah untuk mengonversi gambar yang memiliki satu baris teks.

Contoh kode berikut menunjukkan cara melakukan OCR pada gambar yang memiliki satu baris teks menggunakan Java.

// Untuk contoh lengkap dan file data, silakan buka https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Path ke direktori dokumen.
String dataDir = Utils.getSharedDataDir(RecognizeLine.class);

// Jalur gambar
String imagePath = dataDir + "0001460985.Jpeg";

//Buat instance api
AsposeOCR api = new AsposeOCR();

try {
	String result = api.RecognizeLine(imagePath);
	System.out.println("File: " + imagePath);
	System.out.println("Result line: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Kesimpulan

Pada artikel ini, Anda telah melihat cara mengonversi gambar PNG, JPG, BMP, dan GIF menjadi teks menggunakan Java OCR API. Contoh kode menunjukkan cara melakukan OCR pada gambar yang memiliki satu atau beberapa baris teks dalam aplikasi Java. Anda dapat mempelajari lebih lanjut tentang Java OCR API Aspose menggunakan dokumentasi.

Lihat juga