Gambar OCR ke Teks dan Koreksi Ejaan di Jawa

Kami dapat melakukan OCR pada gambar atau dokumen yang dipindai untuk mengenali dan mengekstrak teks dari gambar secara terprogram menggunakan Java. Kami kemudian dapat menjalankan pemeriksa ejaan untuk memperbaiki kesalahan ejaan dalam teks yang dikenali. Pada artikel ini, kita akan mempelajari cara mengonversi gambar menjadi teks dengan koreksi ejaan di Java.

Topik-topik berikut akan dibahas dalam artikel ini:

  1. Java Image to Text Converter dengan Koreksi Ejaan
  2. Gambar OCR ke Teks dan Dapatkan Kesalahan Ejaan
  3. Konversi Gambar ke Teks dengan Koreksi Ejaan
  4. Simpan Gambar ke Teks dengan Ejaan yang Dikoreksi
  5. Teks Khusus Periksa Ejaan

Pengonversi Gambar ke Teks Java dengan Koreksi Ejaan

Untuk mengubah gambar menjadi teks dengan koreksi ejaan, kita akan menggunakan API Aspose.OCR for Java. Ini memungkinkan melakukan OCR pada gambar yang dipindai, foto ponsel cerdas, tangkapan layar, area gambar, dan PDF yang dipindai. Ini memungkinkan kami untuk menyimpan hasil teks yang dikenali dalam format dokumen populer. API juga memungkinkan konversi gambar menjadi teks dan mengoreksi kesalahan ejaan secara otomatis dalam teks yang dikenali.

Kelas AsposeOCR adalah API utama untuk melakukan operasi OCR. Metode RecognizePage(String fullPath, RecognitionSettings settings) dari kelas ini mengenali teks pada gambar format yang didukung. Metode CorrectSpelling(String text, SpellCheckLanguage language) dari API menggantikan kata yang salah eja dengan kata yang benar dalam teks. Kelas RecognitionResult mewakili hasil pengenalan gambar. Metode saveSpellCheckCorrectedText(string, Format, SpellCheckLanguage, string) kelas ini menyimpan dokumen sebagai teks biasa, PDF, atau Dokumen Microsoft Word. Semua bahasa yang didukung untuk pemeriksa ejaan ditentukan dalam pencacahan SpellCheckLanguage.

Harap unduh JAR API atau tambahkan konfigurasi pom.xml berikut dalam aplikasi Java berbasis Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>22.6</version>
</dependency>

Gambar OCR ke Teks dan Dapatkan Kesalahan Ejaan di Java

Kami dapat melakukan OCR pada gambar dan mendapatkan daftar kesalahan ejaan dalam teks yang dikenali dengan mengikuti langkah-langkah berikut:

  1. Pertama, buat instance dari kelas AsposeOCR.
  2. Selanjutnya, inisialisasi objek dari kelas RecognitionSettings.
  3. Kemudian, dapatkan RecognitionResult dengan memanggil metode RecognizePage(). Dibutuhkan jalur gambar dan objek RecognitionSettings sebagai argumen.
  4. Setelah itu, panggil metode getSpellCheckErrorList() untuk mendapatkan daftar kata yang salah eja dengan saran.
  5. Terakhir, lewati daftar SpellCheckError dan tampilkan hasilnya.

Kode contoh berikut menunjukkan cara mendapatkan daftar kesalahan ejaan dari teks yang dikenali di Java.

// Contoh kode ini menunjukkan cara mendapatkan daftar kesalahan ejaan dari teks yang dikenali
String imagePath = "C:\\Files\\sample.jpg";

// Buat API OCR
AsposeOCR api = new AsposeOCR();

// Inisialisasi pengaturan pengenalan
RecognitionSettings settings = new RecognitionSettings();

// Kenali gambar           
RecognitionResult result = api.RecognizePage(imagePath, settings);

// Dapatkan daftar kata yang salah eja dengan saran
List<SpellCheckError> errorsList = result.getSpellCheckErrorList(SpellCheckLanguage.Eng);

for (SpellCheckError error : errorsList)
{
    // Tunjukkan kata
    System.out.println("Misspelled Word - " + error.word);
  
    // Tampilkan kata-kata yang disarankan
    for(SuggestedWord suggest : error.suggestedWords)
    {
      System.out.println("Suggested word - " + suggest.word);
    }

    System.out.println();
}
Gambar OCR ke Teks dan Dapatkan Kesalahan Ejaan di Java

Dapatkan daftar kesalahan ejaan di Jawa

Konversi Gambar ke Teks dengan Koreksi Ejaan di Java

Kami dapat mengonversi gambar menjadi teks dan mengoreksi kesalahan ejaan secara otomatis dengan mengikuti langkah-langkah berikut:

  1. Pertama, buat instance dari kelas AsposeOCR.
  2. Selanjutnya, inisialisasi objek dari kelas RecognitionSettings.
  3. Kemudian, dapatkan RecognitionResult dengan memanggil metode RecognizePage(). Dibutuhkan jalur gambar dan objek RecognitionSettings sebagai argumen.
  4. Setelah itu, panggil metode getSpellCheckCorrectedText() untuk mendapatkan teks dengan koreksi ejaan.
  5. Terakhir, tunjukkan hasilnya.

Kode contoh berikut menunjukkan cara mengoreksi kesalahan ejaan secara otomatis dari teks yang dikenali di Java.

// Contoh kode ini menunjukkan cara mengoreksi kesalahan ejaan secara otomatis dari teks yang dikenali.
// Jalan ke gambar untuk dikenali
String imagePath = "C:\\Files\\sample.jpg";

// Buat API OCR
AsposeOCR api = new AsposeOCR();

// Inisialisasi pengaturan pengenalan
RecognitionSettings settings = new RecognitionSettings();

// Mengenali teks dari gambar    
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Dapatkan hasil koreksi
String correctedResult = result.getSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Tunjukkan hasil
System.out.println(correctedResult);
Konversi Gambar ke Teks dengan Koreksi Ejaan di Java

Konversi Gambar ke Teks dengan Koreksi Ejaan di Java

Simpan Gambar ke Teks dengan Ejaan yang Dikoreksi di Java

Kami dapat menyimpan teks yang dikenali dari gambar setelah koreksi ejaan dengan mengikuti langkah-langkah berikut:

  1. Pertama, buat instance dari kelas AsposeOCR.
  2. Selanjutnya, inisialisasi objek dari kelas RecognitionSettings.
  3. Setelah itu, dapatkan RecognitionResult dengan memanggil metode RecognizePage(). Dibutuhkan jalur gambar dan objek RecognitionSettings sebagai argumen.
  4. Terakhir, panggil metode saveSpellCheckCorrectedText() untuk menyimpan teks.

Kode contoh berikut menunjukkan cara menyimpan teks dengan koreksi ejaan di Java.

// Contoh kode ini menunjukkan cara menyimpan teks yang dikenali dengan koreksi ejaan.
// Jalan ke gambar untuk dikenali
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";

// Buat API OCR
AsposeOCR api = new AsposeOCR();

// Inisialisasi pengaturan pengenalan
RecognitionSettings settings = new RecognitionSettings();

// Mengenali teks dari gambar 
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Simpan teks yang dikoreksi
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);

Teks Periksa Ejaan di Jawa

Kami juga dapat menjalankan pemeriksaan ejaan pada teks khusus dengan mengikuti langkah-langkah berikut:

  1. Pertama, buat instance dari kelas AsposeOCR.
  2. Selanjutnya, panggil metode CorrectSpelling(). Dibutuhkan teks untuk mengoreksi dan SpellCheckLanguage sebagai argumen.
  3. Terakhir, tunjukkan hasilnya.

Kode contoh berikut menunjukkan cara memeriksa ejaan teks khusus di Java.

// Contoh kode ini menunjukkan cara menjalankan pemeriksaan ejaan pada string teks khusus.
// Teks untuk pemeriksaan ejaan
String textToCorrect = "This is sample text wth errrors";

// Buat API OCR
AsposeOCR api = new AsposeOCR();

// Jalankan Periksa Ejaan untuk memperbaiki kesalahan
String correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Tunjukkan hasil
System.out.println(correctedText);
This is sample text with errors

Dapatkan Lisensi Evaluasi Gratis

Anda bisa mendapatkan lisensi sementara gratis untuk mencoba Aspose.OCR for Java tanpa batasan evaluasi.

Kesimpulan

Dalam artikel ini, kita telah mempelajari cara:

  • melakukan OCR dan mengenali teks pada gambar;
  • mengonversi gambar menjadi teks;
  • dapatkan daftar kata yang salah eja beserta saran kata yang benar;
  • kesalahan ejaan koreksi otomatis;
  • simpan teks yang dikoreksi menggunakan Java.

Selain mengonversi gambar menjadi teks dengan koreksi ejaan, Anda dapat mempelajari lebih lanjut tentang Aspose.OCR for Java API menggunakan dokumentasi. Jika ada ambiguitas, jangan ragu untuk menghubungi kami di forum dukungan gratis.

Lihat juga