تم مسحها ضوئيًا إلى ملف PDF قابل للبحث فيه

في بعض الأحيان يتم إنشاء ملفات PDF باستخدام صور من ماسح ضوئي أو جهاز كاميرا. في حالات معينة ، قد تحتاج إلى تحويل ملف PDF ممسوح ضوئيًا إلى ملف PDF قابل للبحث باستخدام التعرف الضوئي على الحروف ، بحيث يمكنك العمل مع محتويات النص في ملف PDF. وفقًا لذلك ، تتناول هذه المقالة كيفية تحويل ملف PDF ممسوح ضوئيًا إلى ملف PDF قابل للبحث بواسطة ميزة OCR برمجيًا باستخدام Java.

ملف PDF ممسوح ضوئيًا إلى ملف PDF قابل للبحث بواسطة OCR - تثبيت Java API

يمكنك التعرف بصريًا على النص في ملف PDF باستخدام ميزة التعرف الضوئي على الحروف باستخدام Aspose.OCR for Java API. ما عليك سوى تثبيت API عن طريق تنزيل ملف JAR من قسم الإصدارات الجديدة ، أو باستخدام مواصفات Maven أدناه:

مخزن:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

الاعتماد:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

تحويل ملف PDF الممسوح ضوئيًا إلى ملف PDF قابل للبحث برمجيًا باستخدام Java

يمكنك التعرف على محتويات ملف PDF الممسوح ضوئيًا باستخدام OCR. يمكّنك هذا من تحويل ملف PDF ممسوح ضوئيًا إلى مستند PDF قابل للبحث باتباع الخطوات التالية:

  1. قم بإنشاء كائن فئة AsposeOcr.
  2. التعرف على البيانات من ملف PDF الممسوح ضوئيًا باستخدام طريقة RecognizePdf.
  3. قم بتعيين أرقام الصفحات للتعرف على التعرف الضوئي على الحروف باستخدام فئة DocumentRecognitionSettings.
  4. احفظ نتيجة OCR كملف PDF قابل للبحث.

يوضح مقتطف الشفرة التالي كيفية تحويل ملف PDF ممسوح ضوئيًا إلى ملف PDF قابل للبحث برمجيًا في Java:

// تم مسح مسار PDF متعدد الصفحات
String fullPath = "multi_page.pdf";

// تهيئة كائن فئة AsposeOcr
AsposeOCRPdf api = new AsposeOCRPdf();

DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// التعرف على الصور من ملف PDF           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// احفظ النتيجة كملف PDF قابل للبحث
AsposeOCR.SaveMultipageDocument("output.pdf", Format.Pdf, res);

احصل على رخصة تقييم مجانية

يمكنك تقييم الميزة للتعرف على النص في ملف PDF الممسوح ضوئيًا باستخدام عمليات التعرف الضوئي على الحروف بدون أي قيود من خلال طلب ترخيص مؤقت مجاني.

استنتاج

في هذه المقالة ، تعلمت كيفية تحويل ملف PDF ممسوح ضوئيًا إلى مستند PDF قابل للبحث باستخدام ميزة OCR برمجيًا في Java. علاوة على ذلك ، يمكنك إلقاء نظرة على الميزات الأخرى ذات الصلة بـ OCR لواجهة برمجة التطبيقات من خلال زيارة الوثائق. لا تتردد في مراسلتنا على المنتدى في حالة وجود أي مخاوف.

أنظر أيضا