استخراج الصور من مستندات Word في لغة بيثون

صورة تساوي ألف كلمة. هذا هو السبب في أن الصور جزء لا يتجزأ من المستندات ، خاصة مستندات Word. تُستخدم الصور لجعل المحتوى أكثر جاذبية وجاذبية. عند تحليل مستندات Word ، قد تصادف السيناريو حيث تحتاج إلى استخراج الصور. لتحقيق هذا برمجيًا ، تتناول هذه المقالة كيفية استخراج الصور من Word DOC DOCX في Python.

مكتبة Python لاستخراج الصور من مستندات Word DOC DOCX

Aspose.Words for Python هي مكتبة قوية وغنية بالمميزات تُستخدم لإنشاء مستندات Word ومعالجتها. سنستخدم هذه المكتبة لاستخراج الصور من ملفات DOCX أو DOC. يمكنك تثبيته في تطبيقات Python الخاصة بك من PyPI باستخدام أمر pip التالي.

pip install aspose-words

استخراج الصور من Word DOC في Python

يتم تمثيل الصور في مستندات Word بواسطة عقد الشكل. لذلك ، لاسترداد الصور من مستند ، سيتعين عليك تحليل الأشكال. توضح الخطوات التالية كيفية استخراج الصور من مستند Word DOC في Python.

  • أولاً ، قم بتحميل مستند Word باستخدام فئة المستند.
  • بعد ذلك ، استرجع جميع الأشكال في كائن باستخدام طريقة Document.getchildnodes (NodeType.SHAPE ، True).
  • قم بالتكرار خلال الأشكال ولكل شكل ، قم بتنفيذ العمليات التالية:
    • صب الشكل في نوع الشكل باستخدام طريقة asshape().
    • تحقق مما إذا كان الشكل يحتوي على صورة باستخدام طريقة Shape.hasimage().
    • احفظ الشكل كصورة باستخدام طريقة Shape.imagedata.save(string).

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج الصور من مستند Word DOCX في Python.

import aspose.words as aw

# تحميل مستند Word
doc = aw.Document("calibre.docx")

# استرجاع كافة الأشكال
shapes = doc.get_child_nodes(aw.NodeType.SHAPE, True)
imageIndex = 0

# حلقة من خلال الأشكال
for shape in shapes :
    shape = shape.as_shape()
    if (shape.has_image) :

        # تعيين اسم ملف الصورة
        imageFileName = f"Image.ExportImages.{imageIndex}_{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}"

        # احفظ الصورة
        shape.image_data.save(imageFileName)
        imageIndex += 1

API لاستخراج الصور من DOC DOCX - احصل على ترخيص API مجاني

يمكنك الحصول على ترخيص مؤقت لاستخدام Aspose.Words مع Python بدون قيود تقييم.

استنتاج

تُستخدم الصور بشكل شائع في مستندات Word لجعل المحتوى أكثر جاذبية. في حالات مختلفة ، يلزم أيضًا استخراج الصور من المستندات مع النص. لذلك ، في هذه المقالة ، تعلمت كيفية استخراج الصور من مستندات Word DOC DOCX في Python. بالإضافة إلى ذلك ، يمكنك استكشاف وثائق Aspose.Words for Python. إذا كان لديك أي أسئلة ، فلا تتردد في إخبارنا عبر المنتدى.

أنظر أيضا

معلومات: إذا احتجت في أي وقت إلى الحصول على مستند Word من عرض تقديمي لـ PowerPoint ، فيمكنك استخدام محول Aspose Presentation to Word Document.