OCR תמונה לטקסט ותיקון איות ב-C#

אנו יכולים לבצע OCR על תמונות או מסמכים סרוקים ולחלץ נתונים טקסטואליים באופן פרוגרמטי באמצעות C#. לאחר מכן נוכל להפעיל בודק איות כדי לתקן שגיאות כתיב בטקסט המזוהה. במאמר זה נלמד כיצד לבצע תיקון תמונת OCR לטקסט ואיות ב-C#.

הנושאים הבאים יכוסו במאמר זה:

  1. OCR תמונה לטקסט ו-C# Spell Check API
  2. תמונת OCR לטקסט וקבלת שגיאות כתיב
  3. המר תמונה לטקסט עם תיקון איות
  4. שמור טקסט מזוהה עם איות מתוקן
  5. בדיקת איות טקסט מותאם אישית

OCR תמונה לטקסט ו-C# בדיקת איות API

אנו נשתמש ב-Aspose.OCR for .NET API כדי לבצע OCR על תמונות, חילוץ טקסט ותיקון איות. זה יכול לזהות תמונות סרוקות, תמונות סמארטפון, צילומי מסך, אזורי תמונות וקובצי PDF סרוקים. הוא מחזיר תוצאות טקסט מזוהות בפורמטים הפופולריים ביותר של מסמכים וחילופי נתונים. ה-API מאפשר גם המרת תמונות לטקסט ויצירת קובצי PDF הניתנים לחיפוש מסריקות. יתרה מכך, הוא מאפשר תיקון אוטומטי של שגיאות כתיב בטקסט המזוהה.

המחלקה AsposeOcr היא ה-API הראשי של ספריית Aspose OCR. הוא מספק שיטות שונות לביצוע פעולות OCR. השיטה RecognizeImage() של מחלקה זו מזהה טקסט בתמונות של הפורמטים הנתמכים. השיטה CorrectSpelling() של ה-API מחליפה מילים שגוי איות במילים נכונות בטקסט. המחלקה RecognitionResult מייצגת את התוצאות של זיהוי התמונה. השיטה Save(string, SaveFormat, bool, SpellCheckLanguage, string) של מחלקה זו שומרת את המסמך כטקסט רגיל, PDF או מסמך Microsoft Word. כל השפות הנתמכות לבדיקת איות מוגדרות בספירה של SpellCheckLanguage.

אנא הורד את ה-DLL של ה-API או התקן אותו באמצעות NuGet.

PM> Install-Package Aspose.OCR

תמונת OCR לטקסט וקבלת שגיאות כתיב ב-C#

אנו יכולים לבצע OCR על תמונות ולקבל רשימה של שגיאות כתיב בטקסט המוכר על ידי ביצוע השלבים המפורטים להלן:

  1. ראשית, צור מופע של המחלקה AsposeOcr.
  2. לאחר מכן, אתחול אובייקט של המחלקה RecognitionSettings.
  3. לאחר מכן, קבל RecognitionResult על ידי קריאה לשיטת RecognizeImage() . זה לוקח את נתיב התמונה ואת האובייקט RecognitionSettings כארגומנטים.
  4. לאחר מכן, קרא למתודה GetSpellCheckErrorList() כדי לקבל רשימה של מילים באיות שגוי עם הצעות.
  5. לבסוף, עברו דרך רשימת SpellCheckError והצג תוצאות.

הקוד לדוגמה הבא מראה כיצד לקבל רשימה של שגיאות כתיב מטקסט מוכר ב-C#.

// דוגמה זו מדגימה כיצד לקבל רשימה של מילים שגוי איות מטקסט מזוהה.
// נתיב לתמונה לזיהוי
string imagePath = @"C:\Files\OCR\sample.png";

// צור OCR API
AsposeOcr api = new AsposeOcr();

// אתחול הגדרות זיהוי
RecognitionSettings settings = new RecognitionSettings();

// זיהוי תמונה           
RecognitionResult result = api.RecognizeImage(imagePath, settings);

// קבל רשימה של מילים באיות שגוי עם הצעות
List<SpellCheckError> errorsList = result.GetSpellCheckErrorList(SpellCheckLanguage.Eng);

foreach (var word in errorsList)
{
    Console.WriteLine($"Misspelled Word - {word.Word}");
    foreach (var suggest in word.SuggestedWords)
    {
        Console.WriteLine($"Suggested word - {suggest.Word}");
    }

    Console.WriteLine();
}
תמונת OCR לטקסט וקבלת שגיאות כתיב ב-C#

קבלו רשימה של שגיאות כתיב ב-C#

המרת תמונה לטקסט עם תיקון איות ב-C#

אנו יכולים להמיר תמונה לטקסט ולתקן שגיאות כתיב אוטומטית על ידי ביצוע השלבים המפורטים להלן:

  1. ראשית, צור מופע של המחלקה AsposeOcr.
  2. לאחר מכן, אתחול אובייקט של המחלקה RecognitionSettings.
  3. לאחר מכן, קבל RecognitionResult על ידי קריאה לשיטת RecognizeImage() . זה לוקח את נתיב התמונה ואת האובייקט RecognitionSettings כארגומנטים.
  4. לאחר מכן, קרא למתודה GetSpellCheckCorrectedText() כדי לקבל טקסט עם תיקון איות.
  5. לבסוף, הצג את התוצאות.

הקוד לדוגמה הבא מראה כיצד לתקן אוטומטית שגיאות כתיב מטקסט מוכר ב-C#.

// דוגמה זו מדגימה כיצד לתקן שגיאות כתיב אוטומטית מטקסט מזוהה.
// נתיב לתמונה לזיהוי
string imagePath = @"C:\Files\OCR\sample.png";

// צור OCR API
AsposeOcr api = new AsposeOcr();

// אתחול הגדרות זיהוי
RecognitionSettings settings = new RecognitionSettings();

// זיהוי טקסט מתמונה    
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// קבל תוצאה מתוקנת
string correctedResult = result.GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// הראה תוצאות
Console.WriteLine(correctedResult);
המרת תמונה לטקסט עם תיקון איות ב-C#

המרת תמונה לטקסט עם תיקון איות ב-C#

שמור טקסט מזוהה עם איות מתוקן ב-C#

אנו יכולים לשמור את הטקסט המזוהה מתמונה לאחר תיקון איות על ידי ביצוע השלבים המפורטים להלן:

  1. ראשית, צור מופע של המחלקה AsposeOcr.
  2. לאחר מכן, אתחול אובייקט של המחלקה RecognitionSettings.
  3. לאחר מכן, קבל RecognitionResult על ידי קריאה לשיטת RecognizeImage() . זה לוקח את נתיב התמונה ואת האובייקט RecognitionSettings כארגומנטים.
  4. לבסוף, קרא לשיטת Save(string, SaveFormat, bool, SpellCheckLanguage) כדי לשמור את הטקסט. זה לוקח את ערך ה-appleSpellingCorrection bool כ-true.

הקוד לדוגמה הבא מראה כיצד לשמור את הטקסט עם תיקון איות ב-C#.

// דוגמה זו מדגימה כיצד לשמור את הטקסט המזוהה עם תיקון איות.
// נתיב לתמונה לזיהוי
string imagePath = @"C:\Files\OCR\sample.png";
string resultPath = @"C:\Files\OCR\MyResult.txt";

// צור OCR API
AsposeOcr api = new AsposeOcr();

// אתחול הגדרות זיהוי
RecognitionSettings settings = new RecognitionSettings();
         
// זיהוי טקסט מתמונה 
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// שמור את הטקסט המתוקן
result.Save(resultPath, SaveFormat.Text, true, SpellCheckLanguage.Eng);

בדיקת איות טקסט ב-C#

אנו יכולים גם להפעיל בדיקת איות על טקסט מותאם אישית על ידי ביצוע השלבים המפורטים להלן:

  1. ראשית, צור מופע של המחלקה AsposeOcr.
  2. לאחר מכן, קרא למתודה CorrectSpelling() . צריך לתקן את הטקסט ואת SpellCheckLanguage כארגומנטים.
  3. לבסוף, הצג את התוצאות.

הקוד לדוגמה הבא מראה כיצד לבדוק טקסט מותאם אישית ב-C#.

// דוגמה זו מדגימה כיצד להפעיל בדיקת איות על מחרוזת טקסט מותאמת אישית.
// טקסט לבדיקת איות
string textToCorrect = "This is sample text wth errrors";

// צור OCR API
AsposeOcr api = new AsposeOcr();

// הפעל את בדיקת האיות כדי לתקן שגיאות
string correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// הראה תוצאות
Console.WriteLine(correctedText);
This is sample text with errors

קבל רישיון הערכה בחינם

אתה יכול לקבל רישיון זמני בחינם כדי לנסות את Aspose.OCR עבור .NET ללא מגבלות הערכה.

סיכום

במאמר זה למדנו כיצד:

  • לבצע OCR ולזהות טקסט בתמונה ב-C#;
  • קבל רשימה של המילים שגוי איות יחד עם הצעות מילים נכונות;
  • תיקון אוטומטי של שגיאות כתיב;
  • לשמור את הטקסט המתוקן באופן תכנותי.

מלבד OCR תמונה לטקסט ובדיקת איות ב-C#, אתה יכול ללמוד עוד על Aspose.OCR עבור .NET API באמצעות תיעוד. בכל מקרה של אי בהירות, אנא אל תהסס לפנות אלינו ב[פורום התמיכה החינמי] שלנו18.

ראה גם