OCR PDF Python

اسناد پی دی اف اسکن شده به دلیل نداشتن متن قابل جستجو یا ویرایش اغلب برای کار با آنها چالش برانگیز است. با این حال، با قدرت فناوری تشخیص کاراکتر نوری (OCR)، استخراج متن از فایل‌های PDF اسکن شده و تبدیل آنها به فرمت‌های قابل جستجو یا قابل ویرایش به واقعیت تبدیل می‌شود. در این پست وبلاگ، نحوه تشخیص متن PDF با OCR در پایتون را خواهید آموخت. همچنین نحوه استخراج متن از فایل‌های PDF اسکن شده، تبدیل آنها به PDF قابل جستجو یا ویرایش، و آزادسازی پتانسیل قابلیت‌های OCR پایتون با استفاده از کتابخانه Aspose.OCR برای پایتون از طریق .NET را بررسی خواهیم کرد.

تشخیص متن از PDF اسکن شده با OCR – Python API Installation

تشخیص کاراکتر نوری (OCR) یک فناوری است که امکان تبدیل تصاویر یا اسناد اسکن شده به متن قابل خواندن توسط ماشین را فراهم می کند. الگوریتم‌های OCR با تجزیه و تحلیل اشکال و الگوهای کاراکترها در یک تصویر، متن را شناسایی و تشخیص می‌دهند و استخراج و پردازش اطلاعات موجود در آن را ممکن می‌سازند. قبل از شروع، باید Aspose.OCR را برای پایتون از طریق دات نت با دانلود آن از صفحه نسخه های جدید نصب کنید یا با اجرای دستور نصب زیر، آن را از PyPi پیکربندی کنید:

pip install aspose-ocr-python-net

تشخیص متن از PDF با OCR در پایتون

شما می توانید متن را با OCR در پایتون تشخیص دهید یا از PDF استخراج کنید. متن را از یک سند PDF اسکن شده به طور موثر استخراج می کند زیرا مراحل زیر روند ساده تشخیص متن از PDF با OCR در پایتون را نشان می دهد:

  1. یک شی از کلاس AsposeOcr را نمونه سازی کنید.
  2. فایل PDF اسکن شده را بارگیری کنید.
  3. متن را با OCR تشخیص دهید و خروجی را در کنسول چاپ کنید.

کد نمونه زیر نحوه تشخیص متن از PDF با OCR در پایتون را نشان می دهد:

import aspose.ocr as ocr

# Initialize an object of AsposeOcr class
api = ocr.AsposeOcr()

# Load the scanned PDF file
input = ocr.OcrInput(ocr.InputType.PDF)
input.add("source.pdf")

# Recognize text with OCR
result = api.recognize(input)

# Print the output text to the console
print(result[0].recognition_text)

PDF اسکن شده را با OCR در پایتون به PDF قابل جستجو یا قابل ویرایش تبدیل کنید

فایل‌های پی‌دی‌اف اسکن‌شده حاوی تصاویری هستند که نمی‌توانید متن را جستجو کنید، بنابراین باید آن را به یک سند PDF قابل جستجو تبدیل کنید تا سند قابل خواندن برای ماشین باشد و بر اساس آن، آن را بیشتر پردازش کنید. لطفاً مراحل زیر را برای تبدیل آن به یک سند PDF قابل جستجو یا ویرایش در پایتون دنبال کنید:

  1. یک شی از کلاس AsposeOcr ایجاد کنید.
  2. نمونه کلاس [RecognitionSettings][5] را راه اندازی کنید و ویژگی های مورد نیاز را تنظیم کنید.
  3. فایل PDF را بارگیری کنید و محدوده صفحه را برای تشخیص با OCR تنظیم کنید.
  4. فایل PDF قابل جستجوی خروجی را ذخیره کنید.

کد نمونه زیر نحوه تبدیل PDF اسکن شده به سند PDF قابل جستجو با OCR در پایتون را نشان می دهد:

import aspose.ocr as ocr

api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()
settings.auto_denoising = True
settings.auto_contrast = True

# Specify the PDF document as input
input = ocr.OcrInput(ocr.InputType.PDF)

# Access the scanned PDF and set the page number and total number of pages
input.add("source.pdf", 0, 1)

# Process the PDF file for text recognition with OCR
result = api.recognize(input , settings)

# Save the searchable output PDF file
api.save_multipage_document("searchable.pdf", ocr.SaveFormat.PDF, result)

در اینجا قابل توجه است که می توانید هر محدوده ای از صفحات را در سند PDF OCR کنید. به عنوان مثال، تشخیص متن از صفحات خاص فقط در جایی که شاخص صفحه بر اساس صفر است و آخرین پارامتر تعداد صفحاتی است که باید با API پردازش شوند. علاوه بر این، می توانید تنظیمات تشخیص مختلف را برای پیش پردازش فایل منبع مانند حذف نویز، تنظیم کنتراست، بررسی انحراف صفحات ورودی و غیره برای تشخیص پیشرفته و دقیق متن با OCR تنظیم کنید.

مجوز ارزیابی رایگان دریافت کنید

می‌توانید برای ارزیابی API بدون هیچ گونه محدودیت ارزیابی، مجوز موقت رایگان درخواست کنید.

جمع بندی

با قدرت فن آوری OCR و پایتون، استخراج متن از فایل های PDF اسکن شده و تبدیل آنها به فرمت های قابل جستجو یا ویرایش بسیار قابل دسترسی شده است. در اینجا ما فرآیند تشخیص متن PDF با OCR در پایتون را بررسی کرده ایم. ما در مورد فرآیند نصب و استخراج متن از PDF های اسکن شده، پیاده سازی OCR، و تبدیل PDF های اسکن شده به فرمت های قابل جستجو یا قابل ویرایش بحث کردیم. با استفاده از قابلیت‌های OCR و به کارگیری تکنیک‌های پیشرفته، می‌توانید پتانسیل کامل فایل‌های PDF اسکن شده را باز کنید و آنها را در پروژه‌های خود در دسترس‌تر و همه‌کاره‌تر کنید. در صورت وجود هرگونه ابهام یا سؤال، لطفاً از طریق [تالار گفتمان پشتیبانی رایگان7 با ما تماس بگیرید.

همچنین ببینید