แยกรูปภาพจากเอกสารคำในหลาม

ภาพที่มีค่าพันคำ. นี่คือเหตุผลที่รูปภาพเป็นส่วนสำคัญของเอกสาร โดยเฉพาะเอกสาร Word มีการใช้รูปภาพเพื่อทำให้เนื้อหาดูน่าสนใจและสะดุดตายิ่งขึ้น เมื่อแยกวิเคราะห์เอกสาร Word คุณอาจเจอสถานการณ์ที่ต้องแยกรูปภาพ บทความนี้ครอบคลุมถึงวิธีการแยกรูปภาพจาก Word DOC DOCX ใน Python

Python Library เพื่อแยกรูปภาพจากเอกสาร Word DOC DOCX

Aspose.Words for Python เป็นไลบรารีที่ทรงพลังและมีคุณลักษณะมากมายที่ใช้สร้างและจัดการเอกสาร Word เราจะใช้ไลบรารีนี้เพื่อแยกรูปภาพจากไฟล์ DOCX หรือ DOC คุณสามารถติดตั้งในแอปพลิเคชัน Python จาก PyPI โดยใช้คำสั่ง pip ต่อไปนี้

pip install aspose-words

แยกรูปภาพจาก Word DOC ใน Python

รูปภาพในเอกสาร Word จะแสดงโดยโหนดรูปร่าง ดังนั้น ในการเรียกรูปภาพจากเอกสาร คุณจะต้องแยกวิเคราะห์รูปร่าง ขั้นตอนต่อไปนี้แสดงวิธีแยกรูปภาพจาก Word DOC ใน Python

  • ขั้นแรก ให้โหลดเอกสาร Word โดยใช้คลาส Document
  • จากนั้นดึงรูปร่างทั้งหมดลงในวัตถุโดยใช้เมธอด Document.getchildnodes(NodeType.SHAPE, True)
  • วนซ้ำรูปร่างและสำหรับแต่ละรูปร่าง ให้ดำเนินการต่อไปนี้:
    • แปลงรูปร่างเป็นประเภท Shape โดยใช้วิธี asshape()
    • ตรวจสอบว่ารูปร่างมีรูปภาพหรือไม่โดยใช้เมธอด Shape.hasimage()
    • บันทึกรูปร่างเป็นรูปภาพโดยใช้เมธอด Shape.imagedata.save(string)

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแยกรูปภาพจากเอกสาร Word DOCX ใน Python

import aspose.words as aw

# โหลดเอกสาร Word
doc = aw.Document("calibre.docx")

# ดึงรูปร่างทั้งหมด
shapes = doc.get_child_nodes(aw.NodeType.SHAPE, True)
imageIndex = 0

# วนรอบรูปร่าง
for shape in shapes :
    shape = shape.as_shape()
    if (shape.has_image) :

        # ตั้งชื่อไฟล์ภาพ
        imageFileName = f"Image.ExportImages.{imageIndex}_{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}"

        # บันทึกภาพ
        shape.image_data.save(imageFileName)
        imageIndex += 1

API เพื่อแยกรูปภาพออกจาก DOC DOCX - รับใบอนุญาต API ฟรี

คุณสามารถรับ ใบอนุญาตชั่วคราว เพื่อใช้ Aspose.Words for Python ได้โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

รูปภาพมักใช้ในเอกสาร Word เพื่อทำให้เนื้อหาน่าสนใจยิ่งขึ้น ในกรณีต่างๆ จำเป็นต้องแยกรูปภาพออกจากเอกสารพร้อมกับข้อความด้วย ดังนั้นในบทความนี้ คุณได้เรียนรู้วิธีการแยกรูปภาพจากเอกสาร Word DOC DOCX ในภาษา Python นอกจากนี้ คุณสามารถสำรวจ เอกสาร ของ Aspose.Words for Python ในกรณีที่คุณมีคำถามใดๆ โปรดแจ้งให้เราทราบผ่านทาง ฟอรัม ของเรา

ดูสิ่งนี้ด้วย

ข้อมูล: หากคุณต้องการรับเอกสาร Word จากงานนำเสนอ PowerPoint คุณสามารถใช้ตัวแปลง Aspose Presentation to Word Document ได้