ملف PDF ممسوح ضوئيًا للبحث باستخدام OCR في C#

PDF تستند الملفات أحيانًا إلى الصور التي يتم إنشاؤها عادةً باستخدام ماسح ضوئي أو جهاز تصوير. يمكنك تحويل ملف PDF ممسوح ضوئيًا إلى ملف PDF قابل للبحث باستخدام التعرف الضوئي على الحروف بحيث يمكن تحرير النص أو تحديثه في المستند. وفقًا لهذا السيناريو ، توضح هذه المقالة كيفية تحويل ملف PDF ممسوح ضوئيًا إلى ملف PDF قابل للبحث عن طريق عمليات التعرف الضوئي على الحروف برمجيًا باستخدام C#.

ملف PDF ممسوح ضوئيًا إلى ملف PDF قابل للبحث عن طريق تثبيت OCR - C# API

يمكنك إجراء عمليات OCR على ملف PDF ممسوح ضوئيًا باستخدام واجهة برمجة التطبيقات Aspose.OCR for .NET. ما عليك سوى تكوين API عن طريق تنزيل ملف DLL من قسم الإصدارات الجديدة ، أو باستخدام أمر تثبيت NuGet التالي:

PM> Install-Package Aspose.OCR

تحويل ملفات PDF الممسوحة ضوئيًا إلى ملف PDF قابل للبحث برمجيًا باستخدام C#

يمكنك تحويل ملف PDF ممسوح ضوئيًا إلى مستند PDF قابل للبحث مع التعرف على النص بصريًا باتباع الخطوات التالية:

  1. تهيئة AsposeOcr مثيل فئة.
  2. التعرف على الصور من ملف PDF باستخدام طريقة RecognizePdf.
  3. قم بتعيين خصائص مختلفة للتعرف على التعرف الضوئي على الحروف باستخدام فئة DocumentRecognitionSettings.
  4. احفظ نتيجة OCR كملف PDF قابل للبحث.

يوضح مقتطف الشفرة أدناه كيفية تحويل ملف PDF ممسوح ضوئيًا إلى مستند PDF قابل للبحث برمجيًا باستخدام C#:

// تم مسح مسار PDF متعدد الصفحات
string fullPath = "multi_page.pdf";

// تهيئة كائن فئة AsposeOcr
AsposeOcr api = new AsposeOcr();

// التعرف على الصور من ملف PDF           
List<RecognitionResult> res = api.RecognizePdf(fullPath, new DocumentRecognitionSettings
{
    StartPage = 0,
    PagesNumber = 1
});

// احفظ النتيجة كملف PDF قابل للبحث
AsposeOcr.SaveMultipageDocument("output.pdf", SaveFormat.Pdf, res);

احصل على رخصة تقييم مجانية

يمكنك تقييم الميزة للتعرف على النص في ملف PDF الممسوح ضوئيًا باستخدام عمليات التعرف الضوئي على الحروف بدون أي قيود من خلال طلب ترخيص مؤقت مجاني.

استنتاج

في هذه المقالة ، تعلمت كيفية تحويل ملف PDF ممسوح ضوئيًا إلى مستند PDF قابل للبحث عن طريق إجراء عمليات التعرف الضوئي على الحروف عليه برمجيًا في C#. علاوة على ذلك ، يمكنك التحقق من العديد من الميزات الأخرى المتعلقة بـ OCR التي تقدمها API من خلال زيارة الوثائق. لا تتردد في الاتصال بنا على المنتدى في حالة وجود أي استفسارات.

أنظر أيضا