สแกน PDF เป็น Excel OCR Java

ไฟล์ PDF ที่สแกนประกอบด้วยข้อมูลในรูปแบบภาพ เนื่องจากมักสร้างโดยสแกนเนอร์ ในบางสถานการณ์ คุณอาจต้องการข้อมูลตัวเลขจากไฟล์ PDF ที่สแกน คุณจึงดำเนินการ OCR เพื่อสร้างไฟล์ Excel ได้ บทความนี้กล่าวถึงวิธีการสร้างตัวแปลง PDF เป็น Excel ที่สแกนด้วยคุณสมบัติ OCR โดยทางโปรแกรมใน Java

สร้างตัวแปลง PDF เป็น Excel ที่สแกนด้วย OCR – การติดตั้ง Java API

คุณสามารถจดจำข้อความในไฟล์ PDF ได้ด้วยคุณสมบัติ OCR โดยใช้ Aspose.OCR for Java API เพียงติดตั้ง API โดยดาวน์โหลดไฟล์ JAR จากส่วน New Releases หรือใช้ข้อมูลจำเพาะของ Maven ด้านล่าง:

พื้นที่เก็บข้อมูล:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

การพึ่งพา:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

แปลง PDF ที่สแกนเป็น Excel โดยทางโปรแกรมใน Java

คุณสามารถแปลงไฟล์ PDF ที่สแกนเป็น Excel ด้วย OCR โดยทำตามขั้นตอนด้านล่าง:

  1. สร้างวัตถุคลาส AsposeOcr
  2. ระบุการตั้งค่าด้วยคลาส DocumentRecognitionSettings
  3. จดจำไฟล์ PDF ที่สแกนโดยใช้เมธอด RecognizePdf
  4. บันทึกผลลัพธ์ OCR เอาต์พุตเป็นไฟล์ Excel

ข้อมูลโค้ดต่อไปนี้อธิบายวิธีการแปลง PDF ที่สแกนเป็นไฟล์ Excel โดยทางโปรแกรมใน Java:

// เส้นทางไฟล์ PDF ที่สแกน
String fullPath = "scanned.pdf";

// เริ่มต้นวัตถุคลาส AsposeOcr
AsposeOCRPdf api = new AsposeOCRPdf();

// เริ่มต้นวัตถุคลาส DocumentRecognitionSettings
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// จดจำรูปภาพจาก PDF           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// บันทึกผลลัพธ์เป็นไฟล์ Excel XLSX
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);

รับใบอนุญาตการประเมินฟรี

คุณสามารถประเมิน API สำหรับการสร้างตัวแปลง PDF เป็น Excel ที่สแกนโดยการดำเนินการ OCR โดยไม่มีข้อจำกัดใดๆ โดยขอ ใบอนุญาตชั่วคราวฟรี

บทสรุป

ในบทความนี้ คุณได้เข้าใจวิธีการแปลงไฟล์ PDF ที่สแกนเป็นไฟล์ Excel ด้วยคุณสมบัติ OCR โดยทางโปรแกรมใน Java นอกจากนี้ โปรดดูคุณสมบัติอื่นๆ ที่เกี่ยวข้องกับ OCR โดยไปที่ เอกสารประกอบ อย่าลังเลที่จะเขียนถึงเราที่ ฟอรัม ในกรณีที่มีข้อกังวลใดๆ

ดูสิ่งนี้ด้วย