การสแกนเอกสารในภาษาจาวา

ในบล็อกโพสต์นี้ คุณจะสำรวจการสแกนเอกสารในภาษาจาวา ไม่ว่าคุณกำลังสร้างระบบการจัดการเอกสาร แอปมือถือ หรือแอปพลิเคชัน OCR (Optical Character Recognition), OMR (Optical Mark Recognition) คู่มือนี้จะให้ข้อมูลที่จำเป็นแก่คุณเพื่อใช้การสแกนเอกสารโดยใช้ Java

API การสแกนเอกสาร Java

การสแกนเอกสารใน Java เป็นวิธีที่ราบรื่นในการแปลงเอกสารจริงเป็นรูปแบบดิจิทัล มีประโยชน์มากมาย รวมถึงการจัดการเอกสารที่ได้รับการปรับปรุง การแบ่งปันและการจัดเก็บที่ง่ายขึ้น ความสามารถในการค้นหาที่เพิ่มขึ้น และลดความยุ่งเหยิงของกระดาษ ความเข้ากันได้และการสนับสนุนข้ามแพลตฟอร์มของ Java ทำให้เป็นตัวเลือกที่ยอดเยี่ยมสำหรับการนำฟังก์ชันการสแกนเอกสารไปใช้

การสแกนเอกสาร OCR ใน Java

การสแกนเอกสาร Java

OCR เป็นเทคโนโลยีที่ช่วยให้คอมพิวเตอร์จดจำและแยกข้อความจากรูปภาพหรือเอกสารที่สแกน Aspose.OCR for Java ช่วยให้คุณรวมฟังก์ชัน OCR เข้ากับแอปพลิเคชัน Java ทำให้แยกข้อความจากแหล่งต่างๆ และใช้ในโปรแกรมได้ง่ายขึ้น

นอกจากนี้ยังรองรับภาษาสำหรับสคริปต์ละตินและซีริลลิก 27 ตัว รวมถึงภาษาจีนด้วย OCR API สามารถจดจำอินพุตประเภทต่างๆ ได้ เช่น รูปภาพที่สแกน ภาพถ่ายจากสมาร์ทโฟน ภาพหน้าจอ พื้นที่เฉพาะของรูปภาพ และ PDF ที่สแกน

ด้านล่างนี้เป็นรายการคุณสมบัติที่สำคัญบางประการของ Aspose.OCR ที่เกี่ยวข้องกับการสแกนเอกสาร:

  • การแยกข้อความ: จดจำและแยกข้อความจากรูปภาพ ไฟล์ที่สแกน หรือเอกสาร PDF
  • รองรับภาษา: รองรับหลายภาษาเพื่อแยกข้อความในภาษาต่างๆ เช่น อังกฤษ สเปน ฝรั่งเศส เยอรมัน และอื่นๆ
  • อัลกอริทึม OCR ขั้นสูง: ใช้อัลกอริทึม OCR ขั้นสูงเพื่อให้การแยกข้อความแม่นยำและเชื่อถือได้
  • ตัวเลือกการประมวลผลล่วงหน้า: ใช้ฟิลเตอร์รูปภาพ เช่น การกำจัดจุดรบกวน การแก้ไขความเอียง ฯลฯ เพื่อปรับปรุงคุณภาพของภาพที่ป้อนเข้า
  • การผสานรวมอย่างง่าย: ได้รับการออกแบบมาให้รวมเข้ากับแอปพลิเคชัน Java ของคุณได้ง่าย
  • การสแกนลิงค์: จดจำรูปภาพที่ให้ไว้เป็นลิงค์ของเว็บ
  • การสแกนเป็นชุด: เสนอวิธีการประมวลผลแบบชุดต่างๆ เพื่อจดจำภาพหลายภาพในการเรียกครั้งเดียว
  • และอีกมากมาย…

คุณสามารถสำรวจแหล่งข้อมูลต่อไปนี้เพิ่มเติมเพื่อเรียนรู้ API การสแกนเอกสาร Java:

ยิ่งไปกว่านั้น สำหรับการสร้างแอปพลิเคชันสแกนเอกสารที่มีคุณสมบัติ OCR คุณอาจลองใช้ข้อมูลโค้ดต่อไปนี้ในส่วนของคุณ:

// ตัวอย่างรหัสนี้สาธิตวิธีการบันทึกข้อความที่รู้จักด้วยการแก้ไขตัวสะกด
// เส้นทางไปยังภาพที่จะรับรู้
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";

// สร้าง OCR API
AsposeOCR api = new AsposeOCR();

// เริ่มต้นการตั้งค่าการจดจำ
RecognitionSettings settings = new RecognitionSettings();

// จดจำข้อความจากรูปภาพ 
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// บันทึกข้อความที่ถูกแก้ไข
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);

การสแกนเอกสาร OMR ใน Java

เอกสารการสแกน Java

การแยกและรวบรวมข้อมูลจากแบบฟอร์มกระดาษ แบบสำรวจ และการประเมินอาจเป็นงานที่ใช้เวลานานและเกิดข้อผิดพลาดได้ง่าย คุณสามารถลดความซับซ้อนของขั้นตอนการดึงข้อมูลจากเอกสารที่สแกนได้โดยใช้ Aspose.OMR for Java

Aspose.OMR for Java สามารถใช้เพื่อสร้างเทมเพลต OMR แบบกำหนดเองซึ่งกำหนดโครงสร้างและเค้าโครงของแผ่นงาน OMR ในทำนองเดียวกัน มีตัวเลือกที่ยืดหยุ่นสำหรับการส่งออกข้อมูลที่แยกออกมา คุณสามารถบันทึกข้อมูลในรูปแบบต่างๆ รวมถึง CSV, XML, JSON และอื่นๆ ทำให้เข้ากันได้กับระบบและแอปพลิเคชันต่างๆ

ด้านล่างนี้คือลักษณะการสแกนเอกสารบางส่วนของ Aspose.OMR for Java:

  • การรู้จำเครื่องหมาย: ความสามารถในการตรวจจับและจดจำเครื่องหมายที่ทำบนแบบฟอร์มได้อย่างแม่นยำ เช่น ช่องทำเครื่องหมาย ฟองอากาศ หรือบริเวณที่แรเงา
  • การสร้างเทมเพลต: สร้างเทมเพลตที่ปรับแต่งได้ซึ่งกำหนดมุมมองของแบบฟอร์ม รวมถึงการจัดวางคำถาม ตัวเลือกคำตอบ และองค์ประกอบอื่นๆ
  • ความแม่นยำและการตรวจสอบ: อัลกอริทึมและกลไกเพื่อให้แน่ใจว่ามีความแม่นยำสูงในการตรวจจับและจดจำเครื่องหมาย
  • การแก้ไขรูปภาพที่สแกน: ความสามารถในการประมวลผลรูปภาพที่หมุนและมุมมอง (ดูด้านข้าง)
  • และอีกมากมาย…

นอกจากนี้ คุณสามารถเยี่ยมชมแหล่งข้อมูลต่อไปนี้สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการสแกนเอกสารใน Java:

นอกจากนี้ ในการสร้างเครื่องสแกนเอกสารที่มีความสามารถ OMR โดยใช้ Java คุณอาจใช้ข้อมูลโค้ดต่อไปนี้:

// ตัวอย่างรหัสนี้สาธิตวิธีดำเนินการ OMR บนรูปภาพและแยกข้อมูล
// เส้นทางไฟล์เทมเพลต OMR
String templatePath = "C:\\Files\\OMR\\Sheet.omr";

// เส้นทางไฟล์ภาพ
String imagePath = "C:\\Files\\OMR\\Sheet1.png";

// เริ่มต้นเครื่องยนต์ OMR
OmrEngine engine = new OmrEngine();

// รับตัวประมวลผลเทมเพลต
TemplateProcessor templateProcessor = engine.getTemplateProcessor(templatePath);

// รู้จักภาพ
RecognitionResult result = templateProcessor.recognizeImage(imagePath);

// รับผลลัพธ์เป็น CSV
String csvResult = result.getCsv();

// บันทึกไฟล์ CSV
PrintWriter wr = new PrintWriter(new FileOutputStream("C:\\Files\\OMR\\Sheet1.csv"), true);
wr.println(csvResult);

สรุป

การสแกนเอกสารใน Java เปิดโลกแห่งความเป็นไปได้สำหรับการสร้างแอปพลิเคชันที่มีประสิทธิภาพซึ่งจัดการกับเอกสารที่สแกน การแปลงเอกสารเป็นดิจิทัลไม่เพียงแต่ช่วยประหยัดเวลาและทรัพยากรเท่านั้น แต่ยังเพิ่มขีดความสามารถในการจัดการเอกสารที่ปรับปรุงให้ดีขึ้น ปูทางสำหรับเวิร์กโฟลว์ที่คล่องตัวและมีประสิทธิภาพมากขึ้นสำหรับโปรเจกต์ของคุณใน Java

ดูสิ่งนี้ด้วย