PDF סרוק לחיפוש עם OCR ב-C#

קבצי PDF מבוססים לפעמים על תמונות שנוצרות בדרך כלל באמצעות סורק או מכשיר הדמיה. ניתן להמיר קובץ PDF סרוק לקובץ PDF הניתן לחיפוש עם OCR כך שניתן יהיה לערוך או לעדכן את הטקסט במסמך. בהתאם לתרחיש זה, מאמר זה מסביר כיצד להמיר PDF סרוק ל-PDF הניתן לחיפוש על ידי פעולות OCR באופן תוכנתי באמצעות C#.

PDF סרוק ל-PDF ניתן לחיפוש באמצעות OCR - התקנת API של C#

אתה יכול לבצע פעולות OCR על קובץ PDF סרוק עם Aspose.OCR for .NET API. כל שעליך לעשות הוא להגדיר את ה-API על ידי הורדת קובץ ה-DLL מהקטע מהדורות חדשות, או באמצעות פקודת ההתקנה הבאה של NuGet:

PM> Install-Package Aspose.OCR

המר PDF סרוק ל-PDF ניתן לחיפוש באופן פרוגרמטי באמצעות C#

אתה יכול להמיר קובץ PDF סרוק למסמך PDF שניתן לחיפוש תוך זיהוי אופטי של הטקסט על ידי ביצוע השלבים הבאים:

  1. אתחול מופע המחלקה AsposeOcr.
  2. זיהוי תמונות מ-PDF בשיטת RecognizePdf.
  3. הגדר מאפיינים שונים לזיהוי OCR עם המחלקה DocumentRecognitionSettings.
  4. שמור תוצאת OCR כקובץ PDF שניתן לחיפוש.

קטע הקוד שלהלן מסביר כיצד להמיר מסמך PDF סרוק למסמך PDF הניתן לחיפוש באופן תוכנתי באמצעות C#:

// נתיב PDF סרוק מרובה עמודים
string fullPath = "multi_page.pdf";

// אתחול אובייקט המחלקה AsposeOcr
AsposeOcr api = new AsposeOcr();

// זיהוי תמונות מ-PDF           
List<RecognitionResult> res = api.RecognizePdf(fullPath, new DocumentRecognitionSettings
{
    StartPage = 0,
    PagesNumber = 1
});

// שמור את התוצאה כ-PDF הניתן לחיפוש
AsposeOcr.SaveMultipageDocument("output.pdf", SaveFormat.Pdf, res);

קבל רישיון הערכה בחינם

אתה יכול להעריך את התכונה כדי לזהות טקסט ב-PDF סרוק עם פעולות OCR ללא כל הגבלה על ידי בקשת [רישיון זמני חינם].

סיכום

במאמר זה, למדת כיצד להמיר קובץ PDF סרוק למסמך PDF הניתן לחיפוש על ידי ביצוע פעולות OCR עליו באופן תוכנתי ב-C#. יתר על כן, אתה יכול לבדוק כמה תכונות אחרות הקשורות ל-OCR המוצעות על ידי ה-API על ידי ביקור בתיעוד. אנא אל תהסס לפנות אלינו בפורום במקרה של כל שאלה.

ראה גם