บางครั้งไฟล์ PDF จะถูกสร้างขึ้นโดยใช้รูปภาพจากเครื่องสแกนหรืออุปกรณ์กล้อง ในบางสถานการณ์ คุณอาจต้องแปลงไฟล์ PDF ที่สแกนเป็นไฟล์ PDF ที่ค้นหาได้ด้วย OCR เพื่อให้คุณสามารถทำงานกับเนื้อหาที่เป็นข้อความในไฟล์ PDF ได้ ตามนั้น บทความนี้ครอบคลุมวิธีการแปลง PDF ที่สแกนเป็น PDF ที่ค้นหาได้ด้วยคุณสมบัติ OCR โดยทางโปรแกรมโดยใช้ Java
- สแกน PDF เป็น PDF ที่ค้นหาได้ด้วย OCR – การติดตั้ง Java API
- แปลง PDF ที่สแกนเป็น PDF ที่ค้นหาได้ทางโปรแกรมใน Java
สแกน PDF เป็น PDF ที่ค้นหาได้ด้วย OCR – การติดตั้ง Java API
คุณสามารถจดจำข้อความในไฟล์ PDF ได้ด้วยคุณสมบัติ OCR โดยใช้ Aspose.OCR for Java API เพียงติดตั้ง API โดยดาวน์โหลดไฟล์ JAR จากส่วน New Releases หรือใช้ข้อมูลจำเพาะของ Maven ด้านล่าง:
พื้นที่เก็บข้อมูล:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
การพึ่งพา:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>21.12</version>
</dependency>
แปลง PDF ที่สแกนเป็น PDF ที่ค้นหาได้โดยทางโปรแกรมโดยใช้ Java
คุณสามารถรับรู้เนื้อหาของไฟล์ PDF ที่สแกนด้วย OCR ซึ่งจะช่วยให้คุณสามารถแปลงไฟล์ PDF ที่สแกนเป็นเอกสาร PDF ที่ค้นหาได้โดยมีขั้นตอนต่อไปนี้:
- สร้างวัตถุคลาส AsposeOcr
- จดจำข้อมูลจาก PDF ที่สแกนด้วยวิธี RecognizePdf
- ตั้งค่าหมายเลขหน้าสำหรับการจดจำ OCR โดยใช้คลาส DocumentRecognitionSettings
- บันทึกผลลัพธ์ OCR เอาต์พุตเป็นไฟล์ PDF ที่ค้นหาได้
ข้อมูลโค้ดต่อไปนี้อธิบายวิธีการแปลง PDF ที่สแกนเป็นไฟล์ PDF ที่ค้นหาได้โดยใช้โปรแกรมใน Java:
// เส้นทาง PDF ที่สแกนหลายหน้า
String fullPath = "multi_page.pdf";
// เริ่มต้นวัตถุคลาส AsposeOcr
AsposeOCRPdf api = new AsposeOCRPdf();
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);
// จดจำรูปภาพจาก PDF
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);
// บันทึกผลลัพธ์เป็น PDF ที่ค้นหาได้
AsposeOCR.SaveMultipageDocument("output.pdf", Format.Pdf, res);
รับใบอนุญาตการประเมินฟรี
คุณสามารถประเมินคุณสมบัติเพื่อจดจำข้อความใน PDF ที่สแกนด้วยการดำเนินการ OCR โดยไม่มีข้อจำกัดใดๆ โดยขอ ใบอนุญาตชั่วคราวฟรี
บทสรุป
ในบทความนี้ คุณได้เรียนรู้วิธีแปลงไฟล์ PDF ที่สแกนเป็นเอกสาร PDF ที่ค้นหาได้ด้วยคุณสมบัติ OCR ทางโปรแกรมใน Java นอกจากนี้ คุณสามารถดูคุณสมบัติอื่นๆ ที่เกี่ยวข้องกับ OCR ของ API ได้โดยไปที่ เอกสารประกอบ โปรดอย่าลังเลที่จะเขียนถึงเราที่ ฟอรัม ในกรณีที่มีข้อกังวลใดๆ