python'daki kelime belgelerinden görüntüleri ayıklayın

Bir resim bin kelime değerinde bir olup. Resimlerin belgelerin, özellikle Word belgelerinin ayrılmaz bir parçası olmasının nedeni budur. Görüntüler, içeriği daha çekici ve dikkat çekici hale getirmek için kullanılır. Word belgelerini ayrıştırırken, görüntüleri ayıklamanız gereken senaryo ile karşılaşabilirsiniz. Bunu programlı olarak başarmak için, bu makale Python’da Word DOC DOCX’ten görüntülerin nasıl çıkarılacağını kapsar.

Word DOC DOCX Belgelerinden Görüntüleri Çıkarmak için Python Kitaplığı

Aspose.Words for Python, Word belgeleri oluşturmak ve değiştirmek için kullanılan güçlü ve zengin özelliklere sahip bir kitaplıktır. DOCX veya DOC dosyalarından görüntüleri çıkarmak için bu kütüphaneyi kullanacağız. Aşağıdaki pip komutunu kullanarak PyPI üzerinden Python uygulamalarınıza yükleyebilirsiniz.

pip install aspose-words

Python’da Word DOC’tan Görüntüleri Çıkarma

Word belgelerindeki görüntüler, şekil düğümleriyle temsil edilir. Bu nedenle, bir belgeden görüntüleri almak için şekilleri ayrıştırmanız gerekecektir. Aşağıdaki adımlar, Python’da bir Word DOC’den görüntülerin nasıl çıkarılacağını gösterir.

  • İlk olarak, Document sınıfını kullanarak Word belgesini yükleyin.
  • Ardından, Document.getchildnodes(NodeType.SHAPE, True) yöntemini kullanarak tüm şekilleri bir nesneye alın.
  • Şekiller arasında dolaşın ve her şekil için aşağıdaki işlemleri gerçekleştirin:
    • asshape() yöntemini kullanarak şekli Shape türüne dönüştürün.
    • Shape.hasimage() yöntemini kullanarak şeklin görüntüye sahip olup olmadığını kontrol edin.
    • Shape.imagedata.save(string) yöntemini kullanarak şekli bir görüntü olarak kaydedin.

Aşağıdaki kod örneği, Python’da bir Word DOCX belgesinden görüntülerin nasıl çıkarılacağını gösterir.

import aspose.words as aw

# Word belgesini yükle
doc = aw.Document("calibre.docx")

# tüm şekilleri al
shapes = doc.get_child_nodes(aw.NodeType.SHAPE, True)
imageIndex = 0

# şekiller arasında döngü
for shape in shapes :
    shape = shape.as_shape()
    if (shape.has_image) :

        # resim dosyasının adını ayarla
        imageFileName = f"Image.ExportImages.{imageIndex}_{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}"

        # resmi Kaydet
        shape.image_data.save(imageFileName)
        imageIndex += 1

DOC DOCX’ten Görüntüleri Çıkarmak için API - Ücretsiz API Lisansı Alın

Aspose.Words for Python’u değerlendirme sınırlamaları olmadan kullanmak için bir geçici lisans alabilirsiniz.

Çözüm

Görüntüler, içeriği daha çekici hale getirmek için Word belgelerinde yaygın olarak kullanılır. Çeşitli durumlarda, metinle birlikte belgelerden görüntülerin de çıkarılması gerekir. Bu nedenle, bu makalede, Python’da Word DOC DOCX belgelerinden görüntülerin nasıl çıkarılacağını öğrendiniz. Bunun yanı sıra Aspose.Words for Python’un belgelerini inceleyebilirsiniz. Herhangi bir sorunuz olması durumunda forumumuz aracılığıyla bize bildirmekten çekinmeyin.

Ayrıca bakınız

Bilgi: Bir PowerPoint sunumundan bir Word belgesi almanız gerekirse, Aspose Sunumdan Word Belgesine dönüştürücü kullanabilirsiniz.