การสแกนเอกสารใน Python

ในยุคดิจิทัลปัจจุบัน การจัดการเอกสารอย่างมีประสิทธิภาพได้กลายเป็นสิ่งสำคัญยิ่ง การสแกนเอกสารซึ่งเป็นงานที่ใช้เวลานานและใช้แรงงานมาก ได้รับการปฏิวัติโดย Aspose.OCR for Python เป็นโซลูชันที่มุ่งสู่เป้าหมายสำหรับการสแกนเอกสารและการดึงข้อมูลที่มีค่า ซึ่งมอบประโยชน์มากมายให้กับธุรกิจและบุคคลทั่วไป ในบล็อกโพสต์นี้ เราจะสำรวจแง่มุมต่างๆ ของการสแกนเอกสารใน Python ตั้งแต่การประมวลผลภาพล่วงหน้าไปจนถึงการรู้จำอักขระด้วยแสง (OCR) และอื่นๆ

บทความนี้ครอบคลุมหัวข้อต่อไปนี้:

  1. เครื่องสแกนเอกสาร Python API
  2. สแกนเอกสารรูปภาพใน Python
  3. การสแกนเอกสาร PDF ใน Python
  4. การสแกนเอกสาร – ทรัพยากรฟรี

เครื่องสแกนเอกสาร Python API

โปรแกรมสแกนเอกสาร Python

Aspose.OCR for Python เป็นไลบรารีการรู้จำอักขระด้วยแสง (OCR) ที่มีประสิทธิภาพ ซึ่งช่วยให้คุณสามารถดึงข้อความจากรูปภาพและเอกสารที่สแกนได้ สามารถรวมเข้ากับแอปพลิเคชัน Python ของคุณได้อย่างราบรื่น การสแกนเอกสาร ภาพถ่าย หรือรูปภาพอื่นๆ ใช้การเรียนรู้ของเครื่องขั้นสูงและโครงข่ายประสาทเทียมเพื่อจดจำข้อความ

ด้านล่างนี้เป็นรายการคุณสมบัติหลักบางประการของ Aspose.OCR ที่เกี่ยวข้องกับการสแกนเอกสาร:

— การตรวจจับข้อความ: ตรวจหาและจดจำแบบอักษรยอดนิยม รูปแบบแบบอักษร และแม้แต่ข้อความที่เขียนด้วยลายมือ

— การแยกข้อความ: จดจำและแยกข้อความจากรูปภาพ ไฟล์ที่สแกน หรือเอกสาร PDF

— รองรับภาษา: รองรับ 28 ภาษา รวมถึงสคริปต์ละติน ซีริลลิก และเอเชีย

— อัลกอริทึม OCR ขั้นสูง: ใช้อัลกอริธึม OCR ขั้นสูงเพื่อให้การแยกข้อความแม่นยำและเชื่อถือได้

— ตัวเลือกการประมวลผลล่วงหน้า: ประมวลผลภาพที่หมุน เอียง และมีสัญญาณรบกวนได้อย่างมีประสิทธิภาพโดยใช้ฟิลเตอร์ในตัวสำหรับการประมวลผลภาพอัตโนมัติ

— การแก้ไขตัวสะกด: แก้ไขคำที่สะกดผิดโดยอัตโนมัติในผลการจดจำ

— ส่งออกผลลัพธ์การรับรู้: ผลลัพธ์การรับรู้จะถูกส่งคืนในรูปแบบเอกสารและการแลกเปลี่ยนข้อมูลยอดนิยม เช่น ข้อความธรรมดา, HTML, PDF, Word, RTF, EPUB, Excel, JSON และ XML

— การผสานรวมอย่างง่าย: ออกแบบมาเพื่อรวมเข้ากับแอปพลิเคชัน Python ได้อย่างง่ายดาย

— การสแกนลิงค์: จดจำรูปภาพที่ให้ไว้เป็นลิงค์ของเว็บ

— การสแกนและจดจำเป็นชุด: ประมวลผลภาพหลายภาพในโฟลเดอร์หรือไฟล์เก็บถาวรพร้อมกัน

— รองรับรูปแบบอินพุตหลายรูปแบบ: รองรับรูปแบบรูปภาพต่างๆ จากสแกนเนอร์ กล้อง และเว็บลิงก์

  • และอื่น ๆ…

การสแกนเอกสารใน Python - สแกนรูปภาพ

โปรดทำตามขั้นตอนด้านล่างเพื่อสร้างแอปพลิเคชันเครื่องสแกนเอกสารเพื่อสแกนภาพที่มีคุณสมบัติ OCR:

  1. ติดตั้ง Aspose.OCR for Python ในแอปพลิเคชันของคุณ
  2. คัดลอกโค้ดด้านล่างเพื่อสแกนรูปภาพและแยกข้อความ:
# ตัวอย่างโค้ดนี้สาธิตวิธีการสแกนรูปภาพและแยกข้อความ
import aspose.ocr as ocr

# เริ่มต้นเครื่องยนต์ OCR
api = ocr.AsposeOcr()

# เพิ่มรูปภาพลงในชุดการรับรู้
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
input.add("C:\Files\sample.png")

# รับรู้ภาพ
result = api.recognize(input)

# ผลการจดจำการพิมพ์
print(result[0].recognition_text)

การสแกนเอกสาร PDF ใน Python

ในทำนองเดียวกัน เราสามารถสแกนเอกสาร PDF และแยกข้อความโดยทำตามขั้นตอนที่กล่าวถึงก่อนหน้านี้ อย่างไรก็ตาม โปรดใช้ตัวอย่างโค้ดที่ระบุด้านล่าง:

# ตัวอย่างรหัสนี้สาธิตวิธีการสแกนเอกสาร PDF และแยกข้อความ
import aspose.ocr as ocr

# เริ่มต้นเครื่องยนต์ OCR
api = ocr.AsposeOcr()

# เริ่มต้นการตั้งค่าการรับรู้
settings = ocr.RecognitionSettings()
settings.auto_denoising = True
settings.auto_contrast = True

# เพิ่มเอกสาร PDF ลงในแบทช์การรับรู้
input = ocr.OcrInput(ocr.InputType.PDF)
input.add("C:\Files\sample.pdf", 0, 1)

# จำได้
result = api.recognize(input , settings)

# ผลการจดจำการพิมพ์
print(result[0].recognition_text)

การสแกนเอกสารใน Python - แหล่งข้อมูลฟรี

คุณสามารถสำรวจแหล่งข้อมูลต่อไปนี้เพิ่มเติมเพื่อเรียนรู้ API การสแกนเอกสาร Python:

สรุป

โดยสรุป Aspose.OCR for Python ช่วยให้นักพัฒนาและธุรกิจมีโซลูชันการสแกนเอกสารที่มีประสิทธิภาพและเชื่อถือได้ เอ็นจิ้น OCR ที่ทรงพลัง การรองรับภาษา การใช้งานง่าย และการสนับสนุนที่กว้างขวางทำให้เป็นตัวเลือกที่ยอดเยี่ยมสำหรับทุกคนที่ต้องการรวมความสามารถในการสแกนเอกสารเข้ากับแอปพลิเคชัน Python ด้วย Aspose.OCR for Python คุณสามารถปลดล็อกศักยภาพที่แท้จริงของข้อมูล ขับเคลื่อนประสิทธิภาพ และเปิดใช้งานกระบวนการทางธุรกิจที่ชาญฉลาดยิ่งขึ้น ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราที่ ฟอรัมสนับสนุนฟรี

ดูสิ่งนี้ด้วย