OCR รูปภาพเป็นข้อความและแก้ไขการสะกดใน Java

เราสามารถใช้ OCR กับรูปภาพหรือเอกสารที่สแกนเพื่อจดจำและแยกข้อความจากรูปภาพโดยใช้โปรแกรมโดยใช้ Java จากนั้นเราสามารถเรียกใช้ตัวตรวจสอบการสะกดเพื่อแก้ไขข้อผิดพลาดการสะกดในข้อความที่รู้จัก ในบทความนี้ เราจะเรียนรู้วิธีแปลงรูปภาพเป็นข้อความด้วยการแก้ไขตัวสะกดใน Java

หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:

  1. ตัวแปลงรูปภาพเป็นข้อความ Java พร้อมการแก้ไขตัวสะกด
  2. OCR รูปภาพเป็นข้อความและรับข้อผิดพลาดในการสะกดคำ
  3. แปลงรูปภาพเป็นข้อความด้วยการแก้ไขตัวสะกด
  4. บันทึกภาพเป็นข้อความด้วยการสะกดคำที่ถูกต้อง
  5. ตรวจสอบการสะกดข้อความที่กำหนดเอง

ตัวแปลงรูปภาพเป็นข้อความ Java พร้อมการแก้ไขการสะกดคำ

ในการแปลงรูปภาพเป็นข้อความด้วยการแก้ไขการสะกด เราจะใช้ API Aspose.OCR for Java อนุญาตให้ใช้ OCR กับรูปภาพที่สแกน ภาพถ่ายจากสมาร์ทโฟน ภาพหน้าจอ พื้นที่ของรูปภาพ และ PDF ที่สแกน ช่วยให้เราสามารถบันทึกผลลัพธ์ข้อความที่รู้จักใน รูปแบบเอกสารยอดนิยม API ยังอนุญาตให้แปลงรูปภาพเป็นข้อความและแก้ไขคำสะกดผิดอัตโนมัติในข้อความที่รู้จัก

คลาส AsposeOCR เป็น API หลักในการดำเนินการ OCR เมธอด RecognizePage(String fullPath, RecognitionSettings) ของคลาสนี้จะจดจำข้อความบนรูปภาพของ รูปแบบที่รองรับ เมธอด CorrectSpelling(ข้อความสตริง ภาษา SpellCheckLanguage) ของ API จะแทนที่คำที่สะกดผิดด้วยคำที่ถูกต้องในข้อความ คลาส RecognitionResult แสดงผลของการจดจำรูปภาพ เมธอด saveSpellCheckCorrectedText(string, Format, SpellCheckLanguage, string) ของคลาสนี้จะบันทึกเอกสารเป็น ข้อความธรรมดา, PDF หรือ Microsoft Word Document ภาษาที่รองรับทั้งหมดสำหรับการตรวจสอบตัวสะกดถูกกำหนดในการแจงนับ SpellCheckLanguage

โปรด ดาวน์โหลด JAR ของ API หรือเพิ่มการกำหนดค่า pom.xml ต่อไปนี้ในแอปพลิเคชัน Java ที่ใช้ Maven

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>22.6</version>
</dependency>

OCR รูปภาพเป็นข้อความและรับการสะกดผิดใน Java

เราสามารถทำ OCR กับรูปภาพและรับรายการข้อผิดพลาดในการสะกดในข้อความที่รู้จักได้โดยทำตามขั้นตอนด้านล่าง:

  1. ขั้นแรก สร้างอินสแตนซ์ของคลาส AsposeOCR
  2. ถัดไป เริ่มต้นวัตถุของคลาส RecognitionSettings
  3. จากนั้น รับ RecognitionResult โดยเรียกเมธอด RecognizePage() ใช้เส้นทางรูปภาพและวัตถุ RecognitionSettings เป็นอาร์กิวเมนต์
  4. หลังจากนั้น ให้เรียกใช้เมธอด getSpellCheckErrorList() เพื่อรับรายการคำที่สะกดผิดพร้อมคำแนะนำ
  5. สุดท้าย วนซ้ำรายการ SpellCheckError และแสดงผลลัพธ์

โค้ดตัวอย่างต่อไปนี้แสดงวิธีรับรายการการสะกดผิดจากข้อความที่รู้จักใน Java

// ตัวอย่างรหัสนี้สาธิตวิธีรับรายการข้อผิดพลาดการสะกดคำจากข้อความที่รู้จัก
String imagePath = "C:\\Files\\sample.jpg";

// สร้าง OCR API
AsposeOCR api = new AsposeOCR();

// เริ่มต้นการตั้งค่าการจดจำ
RecognitionSettings settings = new RecognitionSettings();

// รู้จักภาพ           
RecognitionResult result = api.RecognizePage(imagePath, settings);

// รับรายการคำที่สะกดผิดพร้อมคำแนะนำ
List<SpellCheckError> errorsList = result.getSpellCheckErrorList(SpellCheckLanguage.Eng);

for (SpellCheckError error : errorsList)
{
    // แสดงคำ
    System.out.println("Misspelled Word - " + error.word);
  
    // แสดงคำที่แนะนำ
    for(SuggestedWord suggest : error.suggestedWords)
    {
      System.out.println("Suggested word - " + suggest.word);
    }

    System.out.println();
}
OCR รูปภาพเป็นข้อความและรับการสะกดผิดใน Java

รับรายการสะกดผิดในภาษาจาวา

แปลงรูปภาพเป็นข้อความด้วยการแก้ไขการสะกดใน Java

เราสามารถแปลงรูปภาพเป็นข้อความและแก้ไขข้อผิดพลาดการสะกดอัตโนมัติโดยทำตามขั้นตอนด้านล่าง:

  1. ขั้นแรก สร้างอินสแตนซ์ของคลาส AsposeOCR
  2. ถัดไป เริ่มต้นวัตถุของคลาส RecognitionSettings
  3. จากนั้น รับ RecognitionResult โดยเรียกเมธอด RecognizePage() ใช้เส้นทางรูปภาพและวัตถุ RecognitionSettings เป็นอาร์กิวเมนต์
  4. หลังจากนั้น ให้เรียกเมธอด getSpellCheckCorrectedText() เพื่อรับข้อความที่มีการแก้ไขตัวสะกด
  5. สุดท้ายแสดงผลลัพธ์

โค้ดตัวอย่างต่อไปนี้แสดงวิธีการแก้ไขข้อผิดพลาดการสะกดโดยอัตโนมัติจากข้อความที่รู้จักใน Java

// ตัวอย่างรหัสนี้สาธิตวิธีการแก้ไขข้อผิดพลาดการสะกดโดยอัตโนมัติจากข้อความที่รู้จัก
// เส้นทางไปยังภาพที่จะรับรู้
String imagePath = "C:\\Files\\sample.jpg";

// สร้าง OCR API
AsposeOCR api = new AsposeOCR();

// เริ่มต้นการตั้งค่าการจดจำ
RecognitionSettings settings = new RecognitionSettings();

// จดจำข้อความจากรูปภาพ    
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// รับผลการแก้ไข
String correctedResult = result.getSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// แสดงผล
System.out.println(correctedResult);
แปลงรูปภาพเป็นข้อความด้วยการแก้ไขการสะกดใน Java

แปลงรูปภาพเป็นข้อความด้วยการแก้ไขการสะกดใน Java

บันทึกภาพเป็นข้อความด้วยการสะกดคำที่ถูกต้องใน Java

เราสามารถบันทึกข้อความที่รู้จักจากรูปภาพหลังจากแก้ไขตัวสะกดโดยทำตามขั้นตอนด้านล่าง:

  1. ขั้นแรก สร้างอินสแตนซ์ของคลาส AsposeOCR
  2. ถัดไป เริ่มต้นวัตถุของคลาส RecognitionSettings
  3. หลังจากนั้น รับ RecognitionResult โดยเรียกเมธอด RecognizePage() ใช้เส้นทางรูปภาพและวัตถุ RecognitionSettings เป็นอาร์กิวเมนต์
  4. สุดท้าย เรียกใช้เมธอด saveSpellCheckCorrectedText() เพื่อบันทึกข้อความ

โค้ดตัวอย่างต่อไปนี้แสดงวิธีการบันทึกข้อความด้วยการแก้ไขการสะกดใน Java

// ตัวอย่างรหัสนี้สาธิตวิธีการบันทึกข้อความที่รู้จักด้วยการแก้ไขตัวสะกด
// เส้นทางไปยังภาพที่จะรับรู้
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";

// สร้าง OCR API
AsposeOCR api = new AsposeOCR();

// เริ่มต้นการตั้งค่าการจดจำ
RecognitionSettings settings = new RecognitionSettings();

// จดจำข้อความจากรูปภาพ 
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// บันทึกข้อความที่ถูกแก้ไข
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);

ตรวจสอบการสะกดข้อความใน Java

เรายังสามารถเรียกใช้การตรวจสอบการสะกดในข้อความที่กำหนดเองโดยทำตามขั้นตอนด้านล่าง:

  1. ขั้นแรก สร้างอินสแตนซ์ของคลาส AsposeOCR
  2. ถัดไป เรียกใช้เมธอด CorrectSpelling() ใช้ข้อความเพื่อแก้ไขและ SpellCheckLanguage เป็นอาร์กิวเมนต์
  3. สุดท้ายแสดงผลลัพธ์

โค้ดตัวอย่างต่อไปนี้แสดงวิธีตรวจสอบการสะกดข้อความแบบกำหนดเองใน Java

// ตัวอย่างโค้ดนี้สาธิตวิธีเรียกใช้การตรวจการสะกดในสตริงข้อความที่กำหนดเอง
// ข้อความสำหรับตรวจสอบการสะกดคำ
String textToCorrect = "This is sample text wth errrors";

// สร้าง OCR API
AsposeOCR api = new AsposeOCR();

// เรียกใช้การตรวจการสะกดเพื่อแก้ไขข้อผิดพลาด
String correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// แสดงผล
System.out.println(correctedText);
This is sample text with errors

รับใบอนุญาตการประเมินฟรี

คุณสามารถ รับใบอนุญาตชั่วคราวได้ฟรี เพื่อลองใช้ Aspose.OCR for Java โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

ในบทความนี้ เราได้เรียนรู้วิธีการ:

  • ดำเนินการ OCR และจดจำข้อความบนภาพ
  • แปลงรูปภาพเป็นข้อความ
  • รับรายการคำที่สะกดผิดพร้อมคำแนะนำคำที่ถูกต้อง
  • แก้ไขข้อผิดพลาดการสะกดคำอัตโนมัติ;
  • บันทึกข้อความที่ถูกต้องโดยใช้ Java

นอกจากการแปลงรูปภาพเป็นข้อความด้วยการแก้ไขการสะกดแล้ว คุณยังสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ Aspose.OCR for Java API โดยใช้ เอกสารประกอบ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราได้ที่ ฟอรัมสนับสนุนฟรี

ดูสิ่งนี้ด้วย