ในบล็อกโพสต์นี้ คุณจะสำรวจการสแกนเอกสารในภาษาจาวา ไม่ว่าคุณกำลังสร้างระบบการจัดการเอกสาร แอปมือถือ หรือแอปพลิเคชัน OCR (Optical Character Recognition), OMR (Optical Mark Recognition) คู่มือนี้จะให้ข้อมูลที่จำเป็นแก่คุณเพื่อใช้การสแกนเอกสารโดยใช้ Java
API การสแกนเอกสาร Java
การสแกนเอกสารใน Java เป็นวิธีที่ราบรื่นในการแปลงเอกสารจริงเป็นรูปแบบดิจิทัล มีประโยชน์มากมาย รวมถึงการจัดการเอกสารที่ได้รับการปรับปรุง การแบ่งปันและการจัดเก็บที่ง่ายขึ้น ความสามารถในการค้นหาที่เพิ่มขึ้น และลดความยุ่งเหยิงของกระดาษ ความเข้ากันได้และการสนับสนุนข้ามแพลตฟอร์มของ Java ทำให้เป็นตัวเลือกที่ยอดเยี่ยมสำหรับการนำฟังก์ชันการสแกนเอกสารไปใช้
การสแกนเอกสาร OCR ใน Java
OCR เป็นเทคโนโลยีที่ช่วยให้คอมพิวเตอร์จดจำและแยกข้อความจากรูปภาพหรือเอกสารที่สแกน Aspose.OCR for Java ช่วยให้คุณรวมฟังก์ชัน OCR เข้ากับแอปพลิเคชัน Java ทำให้แยกข้อความจากแหล่งต่างๆ และใช้ในโปรแกรมได้ง่ายขึ้น
นอกจากนี้ยังรองรับภาษาสำหรับสคริปต์ละตินและซีริลลิก 27 ตัว รวมถึงภาษาจีนด้วย OCR API สามารถจดจำอินพุตประเภทต่างๆ ได้ เช่น รูปภาพที่สแกน ภาพถ่ายจากสมาร์ทโฟน ภาพหน้าจอ พื้นที่เฉพาะของรูปภาพ และ PDF ที่สแกน
ด้านล่างนี้เป็นรายการคุณสมบัติที่สำคัญบางประการของ Aspose.OCR ที่เกี่ยวข้องกับการสแกนเอกสาร:
- การแยกข้อความ: จดจำและแยกข้อความจากรูปภาพ ไฟล์ที่สแกน หรือเอกสาร PDF
- รองรับภาษา: รองรับหลายภาษาเพื่อแยกข้อความในภาษาต่างๆ เช่น อังกฤษ สเปน ฝรั่งเศส เยอรมัน และอื่นๆ
- อัลกอริทึม OCR ขั้นสูง: ใช้อัลกอริทึม OCR ขั้นสูงเพื่อให้การแยกข้อความแม่นยำและเชื่อถือได้
- ตัวเลือกการประมวลผลล่วงหน้า: ใช้ฟิลเตอร์รูปภาพ เช่น การกำจัดจุดรบกวน การแก้ไขความเอียง ฯลฯ เพื่อปรับปรุงคุณภาพของภาพที่ป้อนเข้า
- การผสานรวมอย่างง่าย: ได้รับการออกแบบมาให้รวมเข้ากับแอปพลิเคชัน Java ของคุณได้ง่าย
- การสแกนลิงค์: จดจำรูปภาพที่ให้ไว้เป็นลิงค์ของเว็บ
- การสแกนเป็นชุด: เสนอวิธีการประมวลผลแบบชุดต่างๆ เพื่อจดจำภาพหลายภาพในการเรียกครั้งเดียว
- และอีกมากมาย…
คุณสามารถสำรวจแหล่งข้อมูลต่อไปนี้เพิ่มเติมเพื่อเรียนรู้ API การสแกนเอกสาร Java:
ยิ่งไปกว่านั้น สำหรับการสร้างแอปพลิเคชันสแกนเอกสารที่มีคุณสมบัติ OCR คุณอาจลองใช้ข้อมูลโค้ดต่อไปนี้ในส่วนของคุณ:
// ตัวอย่างรหัสนี้สาธิตวิธีการบันทึกข้อความที่รู้จักด้วยการแก้ไขตัวสะกด
// เส้นทางไปยังภาพที่จะรับรู้
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";
// สร้าง OCR API
AsposeOCR api = new AsposeOCR();
// เริ่มต้นการตั้งค่าการจดจำ
RecognitionSettings settings = new RecognitionSettings();
// จดจำข้อความจากรูปภาพ
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());
// บันทึกข้อความที่ถูกแก้ไข
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);
การสแกนเอกสาร OMR ใน Java
การแยกและรวบรวมข้อมูลจากแบบฟอร์มกระดาษ แบบสำรวจ และการประเมินอาจเป็นงานที่ใช้เวลานานและเกิดข้อผิดพลาดได้ง่าย คุณสามารถลดความซับซ้อนของขั้นตอนการดึงข้อมูลจากเอกสารที่สแกนได้โดยใช้ Aspose.OMR for Java
Aspose.OMR for Java สามารถใช้เพื่อสร้างเทมเพลต OMR แบบกำหนดเองซึ่งกำหนดโครงสร้างและเค้าโครงของแผ่นงาน OMR ในทำนองเดียวกัน มีตัวเลือกที่ยืดหยุ่นสำหรับการส่งออกข้อมูลที่แยกออกมา คุณสามารถบันทึกข้อมูลในรูปแบบต่างๆ รวมถึง CSV, XML, JSON และอื่นๆ ทำให้เข้ากันได้กับระบบและแอปพลิเคชันต่างๆ
ด้านล่างนี้คือลักษณะการสแกนเอกสารบางส่วนของ Aspose.OMR for Java:
- การรู้จำเครื่องหมาย: ความสามารถในการตรวจจับและจดจำเครื่องหมายที่ทำบนแบบฟอร์มได้อย่างแม่นยำ เช่น ช่องทำเครื่องหมาย ฟองอากาศ หรือบริเวณที่แรเงา
- การสร้างเทมเพลต: สร้างเทมเพลตที่ปรับแต่งได้ซึ่งกำหนดมุมมองของแบบฟอร์ม รวมถึงการจัดวางคำถาม ตัวเลือกคำตอบ และองค์ประกอบอื่นๆ
- ความแม่นยำและการตรวจสอบ: อัลกอริทึมและกลไกเพื่อให้แน่ใจว่ามีความแม่นยำสูงในการตรวจจับและจดจำเครื่องหมาย
- การแก้ไขรูปภาพที่สแกน: ความสามารถในการประมวลผลรูปภาพที่หมุนและมุมมอง (ดูด้านข้าง)
- และอีกมากมาย…
นอกจากนี้ คุณสามารถเยี่ยมชมแหล่งข้อมูลต่อไปนี้สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการสแกนเอกสารใน Java:
นอกจากนี้ ในการสร้างเครื่องสแกนเอกสารที่มีความสามารถ OMR โดยใช้ Java คุณอาจใช้ข้อมูลโค้ดต่อไปนี้:
// ตัวอย่างรหัสนี้สาธิตวิธีดำเนินการ OMR บนรูปภาพและแยกข้อมูล
// เส้นทางไฟล์เทมเพลต OMR
String templatePath = "C:\\Files\\OMR\\Sheet.omr";
// เส้นทางไฟล์ภาพ
String imagePath = "C:\\Files\\OMR\\Sheet1.png";
// เริ่มต้นเครื่องยนต์ OMR
OmrEngine engine = new OmrEngine();
// รับตัวประมวลผลเทมเพลต
TemplateProcessor templateProcessor = engine.getTemplateProcessor(templatePath);
// รู้จักภาพ
RecognitionResult result = templateProcessor.recognizeImage(imagePath);
// รับผลลัพธ์เป็น CSV
String csvResult = result.getCsv();
// บันทึกไฟล์ CSV
PrintWriter wr = new PrintWriter(new FileOutputStream("C:\\Files\\OMR\\Sheet1.csv"), true);
wr.println(csvResult);
สรุป
การสแกนเอกสารใน Java เปิดโลกแห่งความเป็นไปได้สำหรับการสร้างแอปพลิเคชันที่มีประสิทธิภาพซึ่งจัดการกับเอกสารที่สแกน การแปลงเอกสารเป็นดิจิทัลไม่เพียงแต่ช่วยประหยัดเวลาและทรัพยากรเท่านั้น แต่ยังเพิ่มขีดความสามารถในการจัดการเอกสารที่ปรับปรุงให้ดีขึ้น ปูทางสำหรับเวิร์กโฟลว์ที่คล่องตัวและมีประสิทธิภาพมากขึ้นสำหรับโปรเจกต์ของคุณใน Java