Gambar OCR ke Teks dan Koreksi Ejaan di C#

Kami dapat melakukan OCR pada gambar atau dokumen yang dipindai dan mengekstrak data tekstual secara terprogram menggunakan C #. Kami kemudian dapat menjalankan pemeriksa ejaan untuk memperbaiki kesalahan ejaan dalam teks yang dikenali. Pada artikel ini, kita akan mempelajari cara melakukan gambar OCR ke teks dan koreksi ejaan di C#.

Topik-topik berikut akan dibahas dalam artikel ini:

  1. Gambar OCR ke Teks dan Koreksi Ejaan C# API
  2. Gambar OCR ke Teks dan Dapatkan Kesalahan Ejaan
  3. Konversi Gambar ke Teks dengan Koreksi Ejaan
  4. Simpan Teks yang Dikenali dengan Ejaan yang Dikoreksi
  5. Teks Khusus Periksa Ejaan

Gambar OCR ke Teks dan Koreksi Ejaan C# API

Kami akan menggunakan API Aspose.OCR for .NET untuk melakukan OCR pada gambar, ekstraksi teks, dan koreksi ejaan. Itu dapat mengenali gambar yang dipindai, foto ponsel cerdas, tangkapan layar, area gambar, dan PDF yang dipindai. Ini mengembalikan hasil teks yang dikenali dalam format dokumen dan pertukaran data paling populer. API juga memungkinkan konversi gambar menjadi teks dan membuat PDF yang dapat dicari dari pindaian. Selain itu, ini memungkinkan kesalahan ejaan koreksi otomatis dalam teks yang dikenali.

Kelas AsposeOcr adalah API utama untuk pustaka Aspose OCR. Ini menyediakan berbagai metode untuk melakukan operasi OCR. Metode RecognizeImage() dari kelas ini mengenali teks pada gambar dari format yang didukung. Metode CorrectSpelling() API menggantikan kata yang salah eja dengan kata yang benar dalam teks. Kelas RecognitionResult mewakili hasil pengenalan gambar. Metode Save(string, SaveFormat, bool, SpellCheckLanguage, string) dari kelas ini menyimpan dokumen sebagai teks biasa, PDF atau Microsoft Word Document. Semua bahasa yang didukung untuk pemeriksa ejaan ditentukan dalam pencacahan SpellCheckLanguage.

Harap unduh DLL API atau instal menggunakan NuGet.

PM> Install-Package Aspose.OCR

Gambar OCR ke Teks dan Dapatkan Kesalahan Ejaan di C#

Kami dapat melakukan OCR pada gambar dan mendapatkan daftar kesalahan ejaan dalam teks yang dikenali dengan mengikuti langkah-langkah berikut:

  1. Pertama, buat instance dari kelas AsposeOcr.
  2. Selanjutnya, inisialisasi objek dari kelas RecognitionSettings.
  3. Kemudian, dapatkan RecognitionResult dengan memanggil metode RecognizeImage(). Dibutuhkan jalur gambar dan objek RecognitionSettings sebagai argumen.
  4. Setelah itu, panggil metode GetSpellCheckErrorList() untuk mendapatkan daftar kata yang salah eja dengan saran.
  5. Terakhir, ulangi daftar SpellCheckError dan tampilkan hasilnya.

Kode contoh berikut menunjukkan cara mendapatkan daftar kesalahan ejaan dari teks yang dikenali di C#.

// Contoh kode ini menunjukkan cara mendapatkan daftar kata yang salah eja dari teks yang dikenali.
// Jalan ke gambar untuk dikenali
string imagePath = @"C:\Files\OCR\sample.png";

// Buat API OCR
AsposeOcr api = new AsposeOcr();

// Inisialisasi pengaturan pengenalan
RecognitionSettings settings = new RecognitionSettings();

// Kenali gambar           
RecognitionResult result = api.RecognizeImage(imagePath, settings);

// Dapatkan daftar kata yang salah eja dengan saran
List<SpellCheckError> errorsList = result.GetSpellCheckErrorList(SpellCheckLanguage.Eng);

foreach (var word in errorsList)
{
    Console.WriteLine($"Misspelled Word - {word.Word}");
    foreach (var suggest in word.SuggestedWords)
    {
        Console.WriteLine($"Suggested word - {suggest.Word}");
    }

    Console.WriteLine();
}
Gambar OCR ke Teks dan Dapatkan Kesalahan Ejaan di C#

Dapatkan daftar kesalahan ejaan di C#

Konversi Gambar ke Teks dengan Koreksi Ejaan di C#

Kami dapat mengonversi gambar menjadi teks dan mengoreksi kesalahan ejaan secara otomatis dengan mengikuti langkah-langkah berikut:

  1. Pertama, buat instance dari kelas AsposeOcr.
  2. Selanjutnya, inisialisasi objek dari kelas RecognitionSettings.
  3. Kemudian, dapatkan RecognitionResult dengan memanggil metode RecognizeImage(). Dibutuhkan jalur gambar dan objek RecognitionSettings sebagai argumen.
  4. Setelah itu, panggil metode GetSpellCheckCorrectedText() untuk mendapatkan teks dengan koreksi ejaan.
  5. Terakhir, tunjukkan hasilnya.

Kode contoh berikut menunjukkan cara mengoreksi kesalahan ejaan secara otomatis dari teks yang dikenali di C#.

// Contoh kode ini menunjukkan cara mengoreksi kesalahan ejaan secara otomatis dari teks yang dikenali.
// Jalan ke gambar untuk dikenali
string imagePath = @"C:\Files\OCR\sample.png";

// Buat API OCR
AsposeOcr api = new AsposeOcr();

// Inisialisasi pengaturan pengenalan
RecognitionSettings settings = new RecognitionSettings();

// Mengenali teks dari gambar    
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Dapatkan hasil koreksi
string correctedResult = result.GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Tunjukkan hasil
Console.WriteLine(correctedResult);
Konversi Gambar ke Teks dengan Koreksi Ejaan di C#

Konversi Gambar ke Teks dengan Koreksi Ejaan di C#

Simpan Teks yang Dikenali dengan Ejaan yang Dikoreksi di C#

Kami dapat menyimpan teks yang dikenali dari gambar setelah koreksi ejaan dengan mengikuti langkah-langkah berikut:

  1. Pertama, buat instance dari kelas AsposeOcr.
  2. Selanjutnya, inisialisasi objek dari kelas RecognitionSettings.
  3. Setelah itu, dapatkan RecognitionResult dengan memanggil metode RecognizeImage(). Dibutuhkan jalur gambar dan objek RecognitionSettings sebagai argumen.
  4. Terakhir, panggil metode Save(string, SaveFormat, bool, SpellCheckLanguage) untuk menyimpan teks. Dibutuhkan nilai bool applySpellingCorrection sebagai benar.

Kode contoh berikut menunjukkan cara menyimpan teks dengan koreksi ejaan di C#.

// Contoh kode ini menunjukkan cara menyimpan teks yang dikenali dengan koreksi ejaan.
// Jalan ke gambar untuk dikenali
string imagePath = @"C:\Files\OCR\sample.png";
string resultPath = @"C:\Files\OCR\MyResult.txt";

// Buat API OCR
AsposeOcr api = new AsposeOcr();

// Inisialisasi pengaturan pengenalan
RecognitionSettings settings = new RecognitionSettings();
         
// Mengenali teks dari gambar 
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// Simpan teks yang dikoreksi
result.Save(resultPath, SaveFormat.Text, true, SpellCheckLanguage.Eng);

Teks Periksa Ejaan dalam C#

Kami juga dapat menjalankan pemeriksaan ejaan pada teks khusus dengan mengikuti langkah-langkah berikut:

  1. Pertama, buat instance dari kelas AsposeOcr.
  2. Selanjutnya, panggil metode CorrectSpelling(). Dibutuhkan teks untuk mengoreksi dan SpellCheckLanguage sebagai argumen.
  3. Terakhir, tunjukkan hasilnya.

Kode contoh berikut menunjukkan cara memeriksa ejaan teks kustom di C#.

// Contoh kode ini menunjukkan cara menjalankan pemeriksaan ejaan pada string teks khusus.
// Teks untuk pemeriksaan ejaan
string textToCorrect = "This is sample text wth errrors";

// Buat API OCR
AsposeOcr api = new AsposeOcr();

// Jalankan Pemeriksaan Ejaan untuk memperbaiki kesalahan
string correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Tunjukkan hasil
Console.WriteLine(correctedText);
This is sample text with errors

Dapatkan Lisensi Evaluasi Gratis

Anda bisa mendapatkan lisensi sementara gratis untuk mencoba Aspose.OCR for .NET tanpa batasan evaluasi.

Kesimpulan

Dalam artikel ini, kita telah mempelajari cara:

  • melakukan OCR dan mengenali teks pada gambar di C#;
  • dapatkan daftar kata yang salah eja beserta saran kata yang benar;
  • kesalahan ejaan koreksi otomatis;
  • simpan teks yang dikoreksi secara terprogram.

Selain itu, Anda dapat mempelajari lebih lanjut tentang Aspose.OCR for .NET API menggunakan dokumentasi. Jika ada ambiguitas, jangan ragu untuk menghubungi kami di forum kami.

Lihat juga