สแกน PDF เพื่อค้นหาด้วย OCR ใน C #

ไฟล์ PDF บางครั้งอิงจากรูปภาพซึ่งมักจะสร้างโดยใช้เครื่องสแกนหรืออุปกรณ์สร้างภาพ คุณสามารถแปลงไฟล์ PDF ที่สแกนเป็นไฟล์ PDF ที่ค้นหาได้ด้วย OCR เพื่อให้สามารถแก้ไขหรืออัปเดตข้อความในเอกสารได้ ตามสถานการณ์ดังกล่าว บทความนี้จะอธิบายวิธีแปลง PDF ที่สแกนเป็น PDF ที่ค้นหาได้ด้วยการดำเนินการ OCR โดยทางโปรแกรมโดยใช้ C#

สแกน PDF เป็น PDF ที่ค้นหาได้ด้วย OCR – การติดตั้ง C# API

คุณสามารถดำเนินการ OCR กับไฟล์ PDF ที่สแกนด้วย Aspose.OCR for .NET API เพียงกำหนดค่า API โดยดาวน์โหลดไฟล์ DLL จากส่วน New Releases หรือใช้คำสั่งติดตั้ง NuGet ต่อไปนี้:

PM> Install-Package Aspose.OCR

แปลง PDF ที่สแกนเป็น PDF ที่ค้นหาได้โดยทางโปรแกรมโดยใช้ C#

คุณสามารถแปลงไฟล์ PDF ที่สแกนเป็นเอกสาร PDF ที่ค้นหาได้ในขณะที่จดจำข้อความด้วยแสงโดยทำตามขั้นตอนด้านล่าง:

  1. เริ่มต้นอินสแตนซ์ของคลาส AsposeOcr
  2. จดจำรูปภาพจาก PDF โดยใช้วิธี RecognizePdf
  3. ตั้งค่าคุณสมบัติต่างๆ สำหรับการจดจำ OCR ด้วยคลาส DocumentRecognitionSettings
  4. บันทึกผลลัพธ์ OCR เป็นไฟล์ PDF ที่ค้นหาได้

ข้อมูลโค้ดด้านล่างอธิบายวิธีแปลง PDF ที่สแกนเป็นเอกสาร PDF ที่ค้นหาได้โดยใช้โปรแกรมโดยใช้ C#:

// เส้นทาง PDF ที่สแกนหลายหน้า
string fullPath = "multi_page.pdf";

// เริ่มต้นวัตถุคลาส AsposeOcr
AsposeOcr api = new AsposeOcr();

// จดจำรูปภาพจาก PDF           
List<RecognitionResult> res = api.RecognizePdf(fullPath, new DocumentRecognitionSettings
{
    StartPage = 0,
    PagesNumber = 1
});

// บันทึกผลลัพธ์เป็น PDF ที่ค้นหาได้
AsposeOcr.SaveMultipageDocument("output.pdf", SaveFormat.Pdf, res);

รับใบอนุญาตการประเมินฟรี

คุณสามารถประเมินคุณสมบัติเพื่อจดจำข้อความใน PDF ที่สแกนด้วยการดำเนินการ OCR โดยไม่มีข้อจำกัดใดๆ โดยขอ ใบอนุญาตชั่วคราวฟรี

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแปลงไฟล์ PDF ที่สแกนเป็นเอกสาร PDF ที่ค้นหาได้โดยการดำเนินการ OCR บนไฟล์นั้นโดยใช้โปรแกรมใน C# นอกจากนี้ คุณสามารถตรวจสอบคุณสมบัติอื่นๆ ที่เกี่ยวข้องกับ OCR ที่นำเสนอโดย API ได้โดยไปที่ เอกสารประกอบ โปรดติดต่อเราได้ที่ ฟอรัม ในกรณีที่มีข้อสงสัยใดๆ

ดูสิ่งนี้ด้วย