ملف PDF ممسوح ضوئيًا إلى Excel OCR Java

تشتمل الملفات الممسوحة ضوئيًا PDF على بيانات بتنسيق صورة لأنها غالبًا ما يتم إنشاؤها بواسطة الماسحات الضوئية. في حالات معينة ، قد تحتاج إلى معلومات رقمية من ملف PDF ممسوح ضوئيًا. حتى تتمكن من إجراء عمليات OCR لإنشاء ملف Excel. تتناول هذه المقالة كيفية إنشاء محول PDF ممسوح ضوئيًا إلى Excel مع ميزة OCR برمجيًا في Java.

قم بإنشاء محول PDF ممسوح ضوئيًا إلى Excel باستخدام OCR - تثبيت Java API

يمكنك التعرف بصريًا على النص في ملف PDF باستخدام ميزة التعرف الضوئي على الحروف باستخدام Aspose.OCR for Java API. ما عليك سوى تثبيت API عن طريق تنزيل ملف JAR من قسم الإصدارات الجديدة ، أو باستخدام مواصفات Maven أدناه:

مخزن:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

الاعتماد:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

تحويل ملف PDF الممسوح ضوئيًا إلى Excel برمجيًا في Java

يمكنك تحويل ملف PDF ممسوح ضوئيًا إلى Excel باستخدام OCR باتباع الخطوات التالية:

  1. قم بإنشاء كائن فئة AsposeOcr.
  2. حدد الإعدادات مع فئة DocumentRecognitionSettings.
  3. التعرف على ملف PDF الممسوح ضوئيًا باستخدام طريقة RecognizePdf.
  4. حفظ نتيجة OCR كملف Excel.

يوضح مقتطف الشفرة التالي كيفية تحويل ملف PDF ممسوح ضوئيًا إلى ملف Excel برمجيًا في Java:

// مسار ملف PDF الممسوح ضوئيًا
String fullPath = "scanned.pdf";

// تهيئة كائن فئة AsposeOcr
AsposeOCRPdf api = new AsposeOCRPdf();

// تهيئة كائن فئة DocumentRecognitionSettings
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// التعرف على الصور من ملف PDF           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// احفظ النتيجة كملف Excel XLSX
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);

احصل على رخصة تقييم مجانية

يمكنك تقييم واجهة برمجة التطبيقات لإنشاء محول PDF ممسوح ضوئيًا إلى Excel عن طريق عمليات التعرف الضوئي على الحروف بدون أي قيود من خلال طلب ترخيص مؤقت مجاني.

استنتاج

في هذه المقالة ، فهمت كيفية تحويل ملف PDF ممسوح ضوئيًا إلى ملف Excel باستخدام ميزة OCR برمجيًا في Java. علاوة على ذلك ، يرجى إلقاء نظرة على الميزات الأخرى المتعلقة بـ OCR من خلال زيارة التوثيق. لا تتردد في مراسلتنا على المنتدى في حالة وجود أي مخاوف.

أنظر أيضا