สแกนเป็น PDF Java ที่ค้นหาได้

บางครั้งไฟล์ PDF จะถูกสร้างขึ้นโดยใช้รูปภาพจากเครื่องสแกนหรืออุปกรณ์กล้อง ในบางสถานการณ์ คุณอาจต้องแปลงไฟล์ PDF ที่สแกนเป็นไฟล์ PDF ที่ค้นหาได้ด้วย OCR เพื่อให้คุณสามารถทำงานกับเนื้อหาที่เป็นข้อความในไฟล์ PDF ได้ ตามนั้น บทความนี้ครอบคลุมวิธีการแปลง PDF ที่สแกนเป็น PDF ที่ค้นหาได้ด้วยคุณสมบัติ OCR โดยทางโปรแกรมโดยใช้ Java

สแกน PDF เป็น PDF ที่ค้นหาได้ด้วย OCR – การติดตั้ง Java API

คุณสามารถจดจำข้อความในไฟล์ PDF ได้ด้วยคุณสมบัติ OCR โดยใช้ Aspose.OCR for Java API เพียงติดตั้ง API โดยดาวน์โหลดไฟล์ JAR จากส่วน New Releases หรือใช้ข้อมูลจำเพาะของ Maven ด้านล่าง:

พื้นที่เก็บข้อมูล:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

การพึ่งพา:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

แปลง PDF ที่สแกนเป็น PDF ที่ค้นหาได้โดยทางโปรแกรมโดยใช้ Java

คุณสามารถรับรู้เนื้อหาของไฟล์ PDF ที่สแกนด้วย OCR ซึ่งจะช่วยให้คุณสามารถแปลงไฟล์ PDF ที่สแกนเป็นเอกสาร PDF ที่ค้นหาได้โดยมีขั้นตอนต่อไปนี้:

  1. สร้างวัตถุคลาส AsposeOcr
  2. จดจำข้อมูลจาก PDF ที่สแกนด้วยวิธี RecognizePdf
  3. ตั้งค่าหมายเลขหน้าสำหรับการจดจำ OCR โดยใช้คลาส DocumentRecognitionSettings
  4. บันทึกผลลัพธ์ OCR เอาต์พุตเป็นไฟล์ PDF ที่ค้นหาได้

ข้อมูลโค้ดต่อไปนี้อธิบายวิธีการแปลง PDF ที่สแกนเป็นไฟล์ PDF ที่ค้นหาได้โดยใช้โปรแกรมใน Java:

// เส้นทาง PDF ที่สแกนหลายหน้า
String fullPath = "multi_page.pdf";

// เริ่มต้นวัตถุคลาส AsposeOcr
AsposeOCRPdf api = new AsposeOCRPdf();

DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// จดจำรูปภาพจาก PDF           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// บันทึกผลลัพธ์เป็น PDF ที่ค้นหาได้
AsposeOCR.SaveMultipageDocument("output.pdf", Format.Pdf, res);

รับใบอนุญาตการประเมินฟรี

คุณสามารถประเมินคุณสมบัติเพื่อจดจำข้อความใน PDF ที่สแกนด้วยการดำเนินการ OCR โดยไม่มีข้อจำกัดใดๆ โดยขอ ใบอนุญาตชั่วคราวฟรี

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแปลงไฟล์ PDF ที่สแกนเป็นเอกสาร PDF ที่ค้นหาได้ด้วยคุณสมบัติ OCR ทางโปรแกรมใน Java นอกจากนี้ คุณสามารถดูคุณสมบัติอื่นๆ ที่เกี่ยวข้องกับ OCR ของ API ได้โดยไปที่ เอกสารประกอบ โปรดอย่าลังเลที่จะเขียนถึงเราที่ ฟอรัม ในกรณีที่มีข้อกังวลใดๆ

ดูสิ่งนี้ด้วย