OCR PDF Python

غالبًا ما يكون التعامل مع مستندات PDF الممسوحة ضوئيًا صعبًا نظرًا لافتقارها إلى نص قابل للبحث أو قابل للتحرير. ومع ذلك ، مع قوة تقنية التعرف الضوئي على الأحرف (OCR) ، يصبح استخراج النص من ملفات PDF الممسوحة ضوئيًا وتحويلها إلى تنسيقات قابلة للبحث أو قابلة للتحرير حقيقة واقعة. في منشور المدونة هذا ، ستتعلم كيفية إجراء التعرف على نص PDF باستخدام OCR في Python. سنستكشف أيضًا كيفية استخراج النص من ملفات PDF الممسوحة ضوئيًا ، وتحويلها إلى ملفات PDF قابلة للبحث أو قابلة للتحرير ، وإطلاق العنان لإمكانيات Python لإمكانيات التعرف الضوئي على الحروف باستخدام مكتبة Aspose.OCR for Python via .NET.

التعرف على النص من ملف PDF الممسوح ضوئيًا باستخدام OCR - تثبيت Python API

التعرف الضوئي على الحروف (OCR) هي تقنية تسمح بتحويل الصور أو المستندات الممسوحة ضوئيًا إلى نص يمكن قراءته آليًا. من خلال تحليل أشكال وأنماط الأحرف في صورة ما ، تقوم خوارزميات التعرف الضوئي على الحروف بتحديد النص والتعرف عليه ، مما يجعل من الممكن استخراج ومعالجة المعلومات الموجودة داخل الصورة. قبل البدء ، تحتاج إلى تثبيت Aspose.OCR لـ Python عبر .NET عن طريق تنزيله من صفحة الإصدارات الجديدة أو تهيئته من PyPi عن طريق تشغيل أمر التثبيت أدناه:

pip install aspose-ocr-python-net

التعرف على النص من PDF باستخدام OCR في Python

يمكنك التعرف على نص أو استخراجه من ملف PDF باستخدام OCR في Python. سيقوم باستخراج النص من مستند PDF ممسوح ضوئيًا بكفاءة حيث توضح الخطوات أدناه العملية البسيطة للتعرف على النص من ملف PDF باستخدام OCR في Python:

  1. إنشاء كائن من فئة AsposeOcr.
  2. قم بتحميل ملف PDF الممسوح ضوئيًا.
  3. التعرف على النص باستخدام التعرف الضوئي على الحروف وطباعة الإخراج على وحدة التحكم.

يوضح نموذج الكود أدناه كيفية التعرف على النص من PDF باستخدام OCR في Python:

import aspose.ocr as ocr

# Initialize an object of AsposeOcr class
api = ocr.AsposeOcr()

# Load the scanned PDF file
input = ocr.OcrInput(ocr.InputType.PDF)
input.add("source.pdf")

# Recognize text with OCR
result = api.recognize(input)

# Print the output text to the console
print(result[0].recognition_text)

تحويل ملف PDF الممسوح ضوئيًا إلى ملف PDF قابل للبحث فيه أو قابل للتحرير باستخدام OCR في Python

تحتوي ملفات PDF الممسوحة ضوئيًا على صور حيث لا يمكنك البحث عن النص ، لذا تحتاج إلى تحويله إلى مستند PDF قابل للبحث فيه لجعل المستند قابلاً للقراءة آليًا ومعالجته وفقًا لذلك. يرجى اتباع الخطوات أدناه لتحويله إلى مستند PDF قابل للبحث فيه أو قابل للتحرير في Python:

  1. قم بإنشاء كائن من AsposeOcr class.
  2. قم بتهيئة مثيل الفئة [RecognitionSettings][5] وضبط الخصائص المطلوبة.
  3. قم بتحميل ملف PDF واضبط نطاق الصفحات للتعرّف عليه باستخدام OCR.
  4. احفظ ملف PDF الذي يمكن البحث فيه.

يوضح نموذج التعليمات البرمجية التالي كيفية تحويل ملف PDF ممسوح ضوئيًا إلى مستند PDF قابل للبحث باستخدام OCR في Python:

import aspose.ocr as ocr

api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()
settings.auto_denoising = True
settings.auto_contrast = True

# Specify the PDF document as input
input = ocr.OcrInput(ocr.InputType.PDF)

# Access the scanned PDF and set the page number and total number of pages
input.add("source.pdf", 0, 1)

# Process the PDF file for text recognition with OCR
result = api.recognize(input , settings)

# Save the searchable output PDF file
api.save_multipage_document("searchable.pdf", ocr.SaveFormat.PDF, result)

ومن الجدير بالذكر هنا أنه يمكنك التعرف الضوئي على الحروف على أي نطاق من الصفحات في مستند PDF. على سبيل المثال ، التعرف على النص من صفحات معينة فقط حيث يكون فهرس الصفحة قائمًا على الصفر والمعلمة الأخيرة هي عدد الصفحات المراد معالجتها باستخدام واجهة برمجة التطبيقات. بالإضافة إلى ذلك ، يمكنك تعيين إعدادات التعرف المختلفة للمعالجة المسبقة للملف المصدر مثل إزالة الضوضاء ، وضبط التباين ، والتحقق من انحراف صفحات الإدخال ، وما إلى ذلك من أجل التعرف المحسن والدقيق على النص باستخدام التعرف الضوئي على الحروف.

احصل على رخصة تقييم مجانية

يمكنك طلب ترخيص مؤقت مجاني لتقييم API بدون أي قيود تقييم.

تلخيص لما سبق

بفضل قوة تقنية OCR و Python ، أصبح استخراج النص من ملفات PDF الممسوحة ضوئيًا وتحويلها إلى تنسيقات قابلة للبحث أو قابلة للتحرير يمكن الوصول إليها بشكل كبير. هنا اكتشفنا عملية التعرف على نص PDF باستخدام OCR في Python. ناقشنا عملية التثبيت واستخراج النص من ملفات PDF الممسوحة ضوئيًا ، وتنفيذ OCR ، وتحويل ملفات PDF الممسوحة ضوئيًا إلى تنسيقات قابلة للبحث أو قابلة للتحرير. من خلال الاستفادة من إمكانات التعرف الضوئي على الحروف واستخدام التقنيات المتقدمة ، يمكنك إطلاق العنان للإمكانات الكاملة لملفات PDF الممسوحة ضوئيًا وجعلها أكثر سهولة ومتعددة الاستخدامات في مشاريعك. في حالة وجود أي غموض أو استفسارات ، يرجى التواصل معنا عبر منتدى الدعم المجاني.

أنظر أيضا