ทำ OCR โดยใช้ C#

OCR (Optical Character Recognition) เป็นเทคโนโลยีที่รู้จักกันดีและใช้กันอย่างแพร่หลายในการจดจำและอ่านข้อความจากภาพและเอกสารที่สแกน ในการทำงาน OCR อักขระบนภาพจะถูกสแกน จดจำ และแปลงเป็นรูปแบบดิจิทัล ข้อความที่แปลงสามารถตรวจสอบและบันทึกเพื่อดำเนินการต่อไปได้ ในบทความนี้ ฉันจะแสดงวิธีทำ OCR เพื่อแปลงรูปภาพเป็นข้อความโดยใช้โปรแกรมโดยใช้ไลบรารี C# .NET OCR ส่วนที่เหลือของบทความแบ่งออกเป็นส่วนต่อไปนี้

ไลบรารี C# OCR - ดาวน์โหลดฟรี

Aspose.OCR for .NET เป็นไลบรารี OCR ที่ทรงพลังและความเร็วสูงสำหรับ C# ซึ่งช่วยให้คุณสแกนและแปลงรูปภาพเป็นข้อความได้อย่างง่ายดาย ไม่ต้องใช้รหัสที่ยาวมากในการทำให้คุณลักษณะ OCR พร้อมใช้งานภายในแอปพลิเคชัน .NET ของคุณ ต่อไปนี้เป็นวิธีการติดตั้งไลบรารี C# OCR

ติดตั้ง C# .NET OCR Library ผ่าน NuGet Package Manager

เพียงค้นหา Aspose.OCR ใน NuGet Package Manager และติดตั้ง

ห้องสมุด C # OCR

ติดตั้ง C# OCR Library ผ่าน Package Manager Console

ต่อไปนี้คือคำสั่งในการติดตั้ง Aspose.OCR ผ่าน Package Manager Console

PM> Install-Package Aspose.OCR

แปลงรูปภาพเป็นข้อความโดยใช้ C# OCR Library

มาดูวิธีการทำ OCR กับภาพที่อาจเป็นหน้าของเอกสารที่สแกน ต่อไปนี้เป็นขั้นตอนในการดำเนินการนี้

  • สร้างอินสแตนซ์ของคลาส AsposeOcr
  • เรียกใช้เมธอด AsposeOcr.RecognizeImage(string) โดยผ่านเส้นทางของรูปภาพและรับผลลัพธ์เป็นวัตถุสตริง

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงรูปภาพเป็นข้อความโดยใช้ C#

// สำหรับตัวอย่างและไฟล์ข้อมูลทั้งหมด โปรดไปที่ https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// เส้นทางไปยังไดเร็กทอรีเอกสาร
string dataDir = RunExamples.GetDataDir_OCR();

// เริ่มต้นอินสแตนซ์ของ AsposeOcr
AsposeOcr api = new AsposeOcr();

// รู้จักภาพ
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");

// แสดงข้อความที่รู้จัก
Console.WriteLine(result);

C# ทำ OCR บนรูปภาพด้วยข้อความบรรทัดเดียว

ในตัวอย่างก่อนหน้านี้ เราได้ทำการ OCR บนรูปภาพซึ่งมีข้อความหลายบรรทัด อย่างไรก็ตาม เป็นไปได้ว่ารูปภาพมีข้อความเพียงบรรทัดเดียว ในกรณีเช่นนี้ คุณสามารถบอกให้ API รู้จักเฉพาะบรรทัดได้ ต่อไปนี้เป็นขั้นตอนในการแปลงรูปภาพที่มีข้อความบรรทัดเดียวใน C#

  • สร้างวัตถุของคลาส AsposeOcr
  • เรียกใช้เมธอด AsposeOcr.RecognizeLine(string) และส่งต่อไปยังพาธของไฟล์รูปภาพ
  • รับผลลัพธ์เป็นวัตถุสตริง

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีดำเนินการ OCR และแปลงรูปภาพที่มีข้อความบรรทัดเดียวโดยใช้ C#

// สำหรับตัวอย่างและไฟล์ข้อมูลทั้งหมด โปรดไปที่ https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// เส้นทางไปยังไดเร็กทอรีเอกสาร
string dataDir = RunExamples.GetDataDir_OCR();

// เริ่มต้นอินสแตนซ์ของ AsposeOcr
AsposeOcr api = new AsposeOcr();

// รู้จักภาพ
string result = api.RecognizeLine(dataDir + "sample_line.png");

// แสดงข้อความที่รู้จัก
Console.WriteLine(result);

ดำเนินการ OCR สำหรับอักขระที่ไม่ใช่ภาษาอังกฤษ

Aspose.OCR ไม่จำกัดคุณสมบัติ OCR สำหรับภาษาอังกฤษ และคุณสามารถจดจำอักขระของภาษาอื่นได้เช่นกัน กระบวนการจดจำและรหัสจะยังคงเหมือนเดิมโดยไม่คำนึงถึงภาษาของข้อความ ต่อไปนี้คือชุดอักขระที่ไลบรารี C# OCR ของ Aspose รู้จัก

OCR สำหรับอักขระที่ไม่ใช่ภาษาอังกฤษ

C# OCR Library - รับใบอนุญาตฟรี

คุณสามารถใช้ Aspose.OCR ได้โดยไม่มีข้อจำกัดในการประเมินโดยขอ [ใบอนุญาตชั่วคราวฟรี][7]

บทสรุป

บทความนี้สาธิตวิธีดำเนินการ OCR และแปลงรูปภาพเป็นข้อความโดยทางโปรแกรมใน C# คุณสามารถจดจำอักขระในภาพที่มีข้อความบรรทัดเดียวหรือหลายบรรทัดได้ เรียนรู้เพิ่มเติมเกี่ยวกับไลบรารี C# OCR จาก เอกสารประกอบ

ดูสิ่งนี้ด้วย