Teknologi Pengenalan Karakter Optik (OCR) telah memungkinkan untuk mengenali dan membaca teks dalam dokumen dan gambar yang dipindai. OCR memungkinkan Anda mengonversi teks hanya-baca menjadi bentuk yang dapat diedit. Teks yang dikonversi selanjutnya dapat diproses untuk operasi seperti analisis teks. Pada artikel ini, saya akan menunjukkan cara melakukan OCR pada gambar (PNG, JPG, BMP, dan GIF) dan mengonversi gambar menjadi teks menggunakan Java OCR API - Aspose.OCR for Java.
- Java OCR API - Instalasi
- Konversi Gambar ke Teks menggunakan Java
- Konversi Gambar yang memiliki Satu Baris Teks menggunakan Java
Tip: Anda mungkin tertarik dengan Text to GIF Converter gratis yang memungkinkan Anda membuat animasi dari teks.
Java OCR API - Instalasi
Aspose.OCR for Java dapat diunduh sebagai JAR atau diinstal dalam aplikasi berbasis Maven menggunakan konfigurasi berikut.
Gudang:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
Ketergantungan:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>20.5</version>
</dependency>
Konversi Gambar ke Teks menggunakan Java
Paling sering, gambar untuk OCR adalah halaman dokumen yang dipindai, faktur, kwitansi, tagihan, dll. Di mana teks terdiri dari beberapa baris. Dalam skenario seperti itu, Anda perlu mengambil seluruh teks dari gambar. Berikut adalah langkah-langkah untuk melakukan OCR pada gambar yang memiliki banyak baris teks menggunakan Aspose.OCR for Java.
- Buat instance dari kelas AsposeOcr.
- Mengonversi gambar menjadi teks menggunakan metode AsposeOcr.recognizePage(String fullPath) dengan meneruskan jalur gambar.
- Dapatkan teks yang dikonversi menjadi objek string.
Contoh kode berikut menunjukkan cara melakukan OCR pada gambar dan mengonversi gambar menjadi teks menggunakan Java.
// Untuk contoh lengkap dan file data, silakan buka https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Path ke direktori dokumen.
String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class);
// Jalur gambar
String imagePath = dataDir + "p3.png";
//Buat instance api
AsposeOCR api = new AsposeOCR();
// Kenali halaman dengan path lengkap ke file
try {
String result = api.RecognizePage(imagePath);
System.out.println("Result: " + result);
} catch (IOException e) {
e.printStackTrace();
}
Konversi Gambar yang memiliki Satu Baris Teks
Pada contoh sebelumnya, kami telah melakukan OCR pada gambar yang memiliki banyak baris teks. Namun, mungkin ada kasus ketika gambar berisi satu baris teks. Untuk kasus seperti itu, Anda dapat mengonfigurasi API yang sesuai. Berikut ini adalah langkah-langkah untuk mengonversi gambar yang memiliki satu baris teks.
- Buat objek dari kelas AsposeOcr.
- Mengonversi gambar menjadi teks menggunakan metode AsposeOcr.recognizeLine(String fullPath).
- Dapatkan hasilnya menjadi objek string.
Contoh kode berikut menunjukkan cara melakukan OCR pada gambar yang memiliki satu baris teks menggunakan Java.
// Untuk contoh lengkap dan file data, silakan buka https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Path ke direktori dokumen.
String dataDir = Utils.getSharedDataDir(RecognizeLine.class);
// Jalur gambar
String imagePath = dataDir + "0001460985.Jpeg";
//Buat instance api
AsposeOCR api = new AsposeOCR();
try {
String result = api.RecognizeLine(imagePath);
System.out.println("File: " + imagePath);
System.out.println("Result line: " + result);
} catch (IOException e) {
e.printStackTrace();
}
Kesimpulan
Pada artikel ini, Anda telah melihat cara mengonversi gambar PNG, JPG, BMP, dan GIF menjadi teks menggunakan Java OCR API. Contoh kode menunjukkan cara melakukan OCR pada gambar yang memiliki satu atau beberapa baris teks dalam aplikasi Java. Anda dapat mempelajari lebih lanjut tentang Java OCR API Aspose menggunakan dokumentasi.