Un’immagine vale più di mille parole. Questo è il motivo per cui le immagini sono parte integrante dei documenti, in particolare dei documenti Word. Le immagini vengono utilizzate per rendere il contenuto più attraente e accattivante. Durante l’analisi dei documenti di Word, potresti imbatterti nello scenario in cui è necessario estrarre le immagini. Per raggiungere questo obiettivo a livello di codice, questo articolo illustra come estrarre immagini da documenti Word in Python.
Libreria Python per estrarre immagini da documenti Word
Aspose.Words for Python è una libreria potente e ricca di funzionalità che viene utilizzata per creare e manipolare documenti Word. Useremo questa libreria per estrarre immagini da file DOCX o DOC. Puoi installarlo nelle tue applicazioni Python da PyPI usando il seguente comando pip.
pip install aspose-words
Estrazione di immagini da documenti Word in Python
Le immagini nei documenti Word sono rappresentate dai nodi forma. Pertanto, per recuperare le immagini da un documento, dovrai analizzare le forme. I passaggi seguenti mostrano come estrarre immagini da un documento Word in Python.
- Innanzitutto, carica il documento di Word utilizzando la classe Document.
- Quindi, recupera tutte le forme in un oggetto usando il metodo Document.getchildnodes(NodeType.SHAPE, True).
- Passa attraverso le forme e per ciascuna forma, esegui le seguenti operazioni:
- Trasmetti la forma nel tipo di forma usando il metodo asshape().
- Controlla se la forma ha un’immagine usando il metodo Shape.hasimage().
- Salva la forma come immagine usando il metodo Shape.imagedata.save(string).
L’esempio di codice seguente mostra come estrarre immagini da un documento DOCX in Python.
import aspose.words as aw
# load the Word document
doc = aw.Document("calibre.docx")
# retrieve all shapes
shapes = doc.get_child_nodes(aw.NodeType.SHAPE, True)
imageIndex = 0
# loop through shapes
for shape in shapes :
shape = shape.as_shape()
if (shape.has_image) :
# set image file's name
imageFileName = f"Image.ExportImages.{imageIndex}_{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}"
# save image
shape.image_data.save(imageFileName)
imageIndex += 1
Ottieni una licenza API gratuita
Puoi ottenere una licenza temporanea per utilizzare Aspose.Words per Python senza limitazioni di valutazione.
Conclusione
Le immagini sono comunemente utilizzate nei documenti Word per rendere il contenuto più accattivante. In vari casi è necessario estrarre anche le immagini dai documenti insieme al testo. Pertanto, in questo articolo, hai imparato come estrarre immagini da documenti Word in Python. Oltre a questo, puoi esplorare la documentazione di Aspose.Words per Python. In caso di domande, non esitare a farcelo sapere tramite il nostro forum.
Guarda anche
- Crea documenti MS Word usando Python
- Converti documento Word in HTML usando Python
- Converti documenti Word in PNG, JPEG o BMP in Python
- Documenti Word su Markdown usando Python
- Confronta due documenti Word in Python
Informazioni: se hai bisogno di ottenere un documento Word da una presentazione PowerPoint, puoi utilizzare il convertitore Aspose Presentazione in documento Word.