استخراج النص من ملف PDF C#

يستخدم تنسيق PDF على نطاق واسع لإنشاء مستندات للقراءة فقط للمشاركة والطباعة. بشكل عام ، تحتوي مستندات PDF على صور مع نصوص وفي حالات معينة ، قد تحتاج إلى استخراج هذه الصور أثناء تحليل ملفات PDF. وفقًا لذلك ، تتناول هذه المقالة كيفية استخراج الصور من PDF برمجيًا في C# .NET.

C# .NET API لاستخراج الصور من ملف PDF - تنزيل مجاني

لاستخراج الصور من ملف PDF ، سنستخدم Aspose.PDF for .NET. إنها واجهة برمجة تطبيقات قوية تتيح لك تنفيذ مجموعة واسعة من ميزات إنشاء ومعالجة ملفات PDF. بالإضافة إلى ذلك ، يسمح لك بتحليل ملف PDF واستخراج الصور بسلاسة. يمكنك إما تنزيل API أو تثبيته باستخدام NuGet.

PM> Install-Package Aspose.PDF

استخراج الصور من ملف PDF في C#

فيما يلي خطوات استخراج الصور من ملف PDF في C#.

  • قم بتحميل المستند باستخدام فئة Document.
  • قم بالتكرار خلال صفحات مستند PDF باستخدام مجموعة Document.Pages.
  • لكل صفحة ، قم بالوصول إلى كل XImage في مجموعة Page.Resources.Images.
  • أنشئ كائن FileStream لكل صورة واحفظه بتنسيق JPEG و PNG وما إلى ذلك.
  • أخيرًا ، أغلق FileStream.

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج الصور من ملف PDF.

// افتح المستند
Document pdfDocument = new Document("candy.pdf");

int imageCounter = 1;

// تكرار الصفحات
foreach (var page in pdfDocument.Pages)
{
    // حلقة من خلال جميع الصور
    foreach (XImage image in page.Resources.Images)
    {
        // إنشاء دفق ملف للصورة
        FileStream outputImage = new FileStream(String.Format("Page{0}_Image{1}.jpg", page.Number, imageCounter), FileMode.Create);

        // حفظ الصورة الناتجة
        image.Save(outputImage, ImageFormat.Jpeg);

        // إغلاق تيار
        outputImage.Close();

        imageCounter++;
    }

    // إعادة تعيين العداد
    imageCounter = 1;
}

احصل على رخصة مجانية

يمكنك استخدام Aspose.PDF for .NET بدون قيود تقييمية باستخدام ترخيص مؤقت.

استنتاج

قد يلزم تحليل ملفات PDF واستخراج النص أو الصور في حالات مختلفة. في هذه المقالة ، تعلمت كيفية استخراج الصور من ملفات PDF برمجيًا في C#. يمكنك استكشاف المزيد حول واجهة برمجة تطبيقات C# PDF باستخدام التوثيق. أيضًا ، يمكنك نشر استفساراتك على المنتدى.

أنظر أيضا