اسکن شده به PDF قابل جستجو جاوا

گاهی اوقات فایل‌های PDF با استفاده از تصاویر یک دستگاه اسکنر یا دوربین ایجاد می‌شوند. در شرایط خاص، ممکن است لازم باشد یک فایل PDF اسکن شده را با OCR به یک فایل PDF قابل جستجو تبدیل کنید تا بتوانید با محتوای متنی موجود در فایل PDF کار کنید. مطابق با آن، این مقاله نحوه تبدیل یک PDF اسکن شده به یک PDF قابل جستجو توسط ویژگی OCR را با استفاده از جاوا پوشش می دهد.

PDF اسکن شده به PDF قابل جستجو توسط OCR – جاوا API نصب

با استفاده از Aspose.OCR for Java API می‌توانید متن را در یک فایل PDF با ویژگی OCR تشخیص دهید. به سادگی با دانلود فایل JAR از بخش انتشارهای جدید یا با استفاده از مشخصات Maven زیر، API را نصب کنید:

مخزن:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

وابستگی:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

تبدیل PDF اسکن شده به PDF قابل جستجو با استفاده از جاوا

شما می توانید محتویات یک فایل PDF اسکن شده را با OCR تشخیص دهید. این به شما امکان می دهد با انجام مراحل زیر یک فایل PDF اسکن شده را به یک سند PDF قابل جستجو تبدیل کنید:

  1. یک شی کلاس AsposeOcr ایجاد کنید.
  2. داده های PDF اسکن شده را با روش RecognizePdf شناسایی کنید.
  3. با استفاده از کلاس DocumentRecognitionSettings شماره صفحه را برای تشخیص OCR تنظیم کنید.
  4. نتیجه OCR خروجی را به عنوان یک فایل PDF قابل جستجو ذخیره کنید.

قطعه کد زیر نحوه تبدیل یک پی دی اف اسکن شده به یک فایل پی دی اف قابل جستجو را بصورت برنامه نویسی در جاوا شرح می دهد:

// مسیر PDF چند صفحه ای اسکن شده
String fullPath = "multi_page.pdf";

// شی کلاس AsposeOcr را راه اندازی کنید
AsposeOCRPdf api = new AsposeOCRPdf();

DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// تشخیص تصاویر از PDF           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// نتیجه را به عنوان PDF قابل جستجو ذخیره کنید
AsposeOCR.SaveMultipageDocument("output.pdf", Format.Pdf, res);

مجوز ارزیابی رایگان را دریافت کنید

می‌توانید با درخواست [مجوز موقت رایگان]، این ویژگی را برای تشخیص متن در PDF اسکن شده با عملیات OCR بدون هیچ محدودیتی ارزیابی کنید.

نتیجه

در این مقاله شما یاد گرفتید که چگونه یک فایل PDF اسکن شده را به یک سند PDF قابل جستجو با ویژگی OCR به صورت برنامه نویسی در جاوا تبدیل کنید. علاوه بر این، می‌توانید با مراجعه به مستندات به سایر ویژگی‌های مربوط به OCR در API نگاهی بیندازید. لطفاً در صورت هر گونه نگرانی با ما در تالار گفتمان بنویسید.

همچنین ببینید