اسکن PDF به Excel OCR جاوا

فایل های اسکن شده PDF داده ها را در قالب تصویر تشکیل می دهند زیرا اغلب توسط اسکنرها ایجاد می شوند. در شرایط خاص، ممکن است به اطلاعات عددی از یک فایل PDF اسکن شده نیاز داشته باشید. بنابراین می توانید عملیات OCR را برای ایجاد یک فایل اکسل انجام دهید. این مقاله نحوه ایجاد یک تبدیل پی دی اف اسکن شده به اکسل با ویژگی OCR را به صورت برنامه نویسی در جاوا را پوشش می دهد.

تبدیل پی دی اف اسکن شده به اکسل را با نصب OCR – Java API ایجاد کنید

با استفاده از Aspose.OCR for Java API می‌توانید متن را در یک فایل PDF با ویژگی OCR تشخیص دهید. به سادگی با دانلود فایل JAR از بخش انتشارهای جدید یا با استفاده از مشخصات Maven زیر، API را نصب کنید:

مخزن:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

وابستگی:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

تبدیل پی دی اف اسکن شده به اکسل به صورت برنامه نویسی در جاوا

با دنبال کردن مراحل زیر می توانید یک فایل PDF اسکن شده را با OCR به Excel تبدیل کنید:

  1. یک شی کلاس AsposeOcr ایجاد کنید.
  2. تنظیمات را با کلاس DocumentRecognitionSettings مشخص کنید.
  3. فایل PDF اسکن شده را با استفاده از روش RecognizePdf شناسایی کنید.
  4. نتیجه OCR خروجی را به عنوان یک فایل اکسل ذخیره کنید.

قطعه کد زیر نحوه تبدیل یک پی دی اف اسکن شده به یک فایل اکسل را به صورت برنامه نویسی در جاوا شرح می دهد:

// مسیر فایل پی دی اف اسکن شده
String fullPath = "scanned.pdf";

// شی کلاس AsposeOcr را راه اندازی کنید
AsposeOCRPdf api = new AsposeOCRPdf();

// شی کلاس DocumentRecognitionSettings را راه اندازی کنید
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// تشخیص تصاویر از PDF           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// نتیجه را به عنوان فایل اکسل XLSX ذخیره کنید
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);

مجوز ارزیابی رایگان را دریافت کنید

می‌توانید با درخواست [مجوز موقت رایگان]، API را برای ایجاد تبدیل پی‌دی‌اف اسکن شده به اکسل توسط عملیات OCR بدون هیچ محدودیتی ارزیابی کنید.

نتیجه

در این مقاله، نحوه تبدیل یک فایل پی دی اف اسکن شده به فایل اکسل را با ویژگی OCR به صورت برنامه نویسی در جاوا آشنا کرده اید. علاوه بر این، لطفاً با مراجعه به [اسناد] به سایر ویژگی‌های مربوط به OCR نگاهی بیندازید. در صورت وجود هر گونه نگرانی می توانید با ما در [فروم 9 بنویسید.

همچنین ببینید