استخراج نص من ملفات PowerPoint في Python

في سيناريوهات مختلفة ، يتم استخراج النص من المستندات لمزيد من المعالجة مثل تحليل النص والتصنيف وما إلى ذلك. من بين المستندات الأخرى مثل PDF و Word ، تُستخدم ملفات PowerPoint أيضًا في استخراج النص. لذلك ، تهدف هذه المقالة إلى توضيح كيفية استخراج النص من PowerPoint PPT في Python. سنغطي كيفية استخراج النص من شريحة معينة أو العرض التقديمي بأكمله.

مكتبة Python لاستخراج النص من PowerPoint PPT

لاستخراج نص من PowerPoint PPT ، سنستخدم Aspose.Slides for Python عبر .NET. إنها مكتبة Python غنية بالميزات لإنشاء عروض PowerPoint التقديمية وتحديثها. علاوة على ذلك ، يسمح لك بمعالجة العروض التقديمية وتحويلها بسلاسة. يمكنك تثبيت هذه المكتبة من PyPI باستخدام أمر pip التالي.

> pip install aspose.slides 

استخراج النص من PowerPoint PPT في Python

اعتمادًا على السيناريو ، قد تحتاج إلى استخراج النص إما من عرض PowerPoint التقديمي بأكمله أو بعض الشرائح المحددة. في الأقسام التالية ، سنوضح كيفية إجراء استخراج النص في كلتا الحالتين المذكورتين أعلاه. لذلك دعونا نمضي قدما.

Python: استخراج نص من شريحة PPT محددة

فيما يلي خطوات استخراج نص من شريحة معينة في PPT في Python.

  • أولاً ، استخدم طريقة PresentationFactory().getpresentationtext (سلسلة ، TextExtractionArrangingMode) طريقة للحصول على جميع أنواع النص في العرض التقديمي.

  • بعد ذلك ، استخدم الفهرس لاستخراج نص شريحة محددة من مصفوفة نصية.

  • فيما يلي أنواع النصوص التي يمكنك استخراجها:

    • نص الشريحة

    • ملحوظات

    • نص تخطيط الشريحة

    • نص الشريحة الرئيسية

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج نص من شريحة PPT معينة في Python.

import aspose.slides as slides

# احصل على كل النص من العرض
text = slides.PresentationFactory().get_presentation_text("presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED)

# اطبع نص الشريحة المرغوبة باستخدام الفهرس الخاص بها
print(text.slides_text[0].text)
print(text.slides_text[0].layout_text)
print(text.slides_text[0].master_text)
print(text.slides_text[0].notes_text)

استخراج نص من PowerPoint كامل PPT في بايثون

توضح الخطوات التالية كيفية استخراج النص من جميع شرائح عرض PowerPoint التقديمي.

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج نص من ملف PPTX (أو PPT) في Python.

import aspose.slides as slides

# احصل على كل النص من العرض
text = slides.PresentationFactory().get_presentation_text("presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED)

# قم بتحميل العرض التقديمي للحصول على عدد الشرائح
with slides.Presentation("presentation.pptx") as ppt:

    # حلقة متكررة خلال الشرائح في العرض التقديمي
   for index in range(ppt.slides.length):

        # اطبع نصًا من الأقسام المطلوبة مثل نص الشريحة ونص التخطيط والملاحظات وما إلى ذلك.
        print(text.slides_text[index].text)
        print(text.slides_text[index].layout_text)
        print(text.slides_text[index].master_text)
        print(text.slides_text[index].notes_text)

مكتبة استخراج نص Python PPT - احصل على ترخيص مجاني

يمكنك استخدام Aspose.Slides لـ Python بدون قيود تقييم من خلال الحصول على ترخيص مؤقت.

استنتاج

في هذه المقالة ، تعلمت كيفية استخراج النص من PowerPoint PPT في Python. لقد رأيت كيفية استخراج نص من شريحة معينة أو كل الشرائح في عرض تقديمي لـ PowerPoint. بالإضافة إلى ذلك ، يمكنك استكشاف ميزات أخرى لـ Aspose.Slides for Python باستخدام التوثيق. يمكنك أيضًا مشاركة استفساراتك معنا عبر المنتدى.

أنظر أيضا