estrarre immagini da documenti Word in Python

Un’immagine vale più di mille parole. Questo è il motivo per cui le immagini sono parte integrante dei documenti, in particolare dei documenti Word. Le immagini vengono utilizzate per rendere il contenuto più attraente e accattivante. Durante l’analisi dei documenti di Word, potresti imbatterti nello scenario in cui è necessario estrarre le immagini. Per raggiungere questo obiettivo a livello di codice, questo articolo illustra come estrarre immagini da documenti Word in Python.

Libreria Python per estrarre immagini da documenti Word

Aspose.Words for Python è una libreria potente e ricca di funzionalità che viene utilizzata per creare e manipolare documenti Word. Useremo questa libreria per estrarre immagini da file DOCX o DOC. Puoi installarlo nelle tue applicazioni Python da PyPI usando il seguente comando pip.

pip install aspose-words

Estrazione di immagini da documenti Word in Python

Le immagini nei documenti Word sono rappresentate dai nodi forma. Pertanto, per recuperare le immagini da un documento, dovrai analizzare le forme. I passaggi seguenti mostrano come estrarre immagini da un documento Word in Python.

  • Innanzitutto, carica il documento di Word utilizzando la classe Document.
  • Quindi, recupera tutte le forme in un oggetto usando il metodo Document.getchildnodes(NodeType.SHAPE, True).
  • Passa attraverso le forme e per ciascuna forma, esegui le seguenti operazioni:
    • Trasmetti la forma nel tipo di forma usando il metodo asshape().
    • Controlla se la forma ha un’immagine usando il metodo Shape.hasimage().
    • Salva la forma come immagine usando il metodo Shape.imagedata.save(string).

L’esempio di codice seguente mostra come estrarre immagini da un documento DOCX in Python.

import aspose.words as aw

# load the Word document
doc = aw.Document("calibre.docx")

# retrieve all shapes
shapes = doc.get_child_nodes(aw.NodeType.SHAPE, True)
imageIndex = 0

# loop through shapes
for shape in shapes :
    shape = shape.as_shape()
    if (shape.has_image) :

        # set image file's name
        imageFileName = f"Image.ExportImages.{imageIndex}_{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}"

        # save image
        shape.image_data.save(imageFileName)
        imageIndex += 1

Ottieni una licenza API gratuita

Puoi ottenere una licenza temporanea per utilizzare Aspose.Words per Python senza limitazioni di valutazione.

Conclusione

Le immagini sono comunemente utilizzate nei documenti Word per rendere il contenuto più accattivante. In vari casi è necessario estrarre anche le immagini dai documenti insieme al testo. Pertanto, in questo articolo, hai imparato come estrarre immagini da documenti Word in Python. Oltre a questo, puoi esplorare la documentazione di Aspose.Words per Python. In caso di domande, non esitare a farcelo sapere tramite il nostro forum.

Guarda anche

Informazioni: se hai bisogno di ottenere un documento Word da una presentazione PowerPoint, puoi utilizzare il convertitore Aspose Presentazione in documento Word.