Estrai immagini da documenti Word utilizzando Java

Le immagini sono comunemente usate per rappresentare informazioni importanti nei documenti di Word. L’inclusione di immagini accanto al testo rende il contenuto più accattivante. In alcuni casi, potrebbe essere necessario estrarre le immagini incorporate nei documenti di Word a livello di codice. Per raggiungere questo obiettivo, questo articolo spiega come estrarre immagini da documenti Word utilizzando Java.

API Java per estrarre immagini da documenti Word

Aspose.Words for Java è un’API potente e ricca di funzionalità per la creazione, la manipolazione e la conversione di documenti MS Word. Pertanto, utilizzeremo questa API per estrarre immagini da documenti MS Word DOCX/DOC. Puoi scaricare il JAR dell’API o installarlo nella tua applicazione Java utilizzando le seguenti configurazioni Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Come estrarre immagini da un documento di Word

Le immagini in un documento di Word sono rappresentate utilizzando oggetti forma. Pertanto, per recuperare le immagini, dovrai elaborare ogni forma nel documento. Di seguito sono riportati i passaggi per estrarre immagini da un documento Word DOCX in Java.

L’esempio di codice seguente mostra come estrarre immagini da un documento DOCX in Java.

// Carica documento Word
Document doc = new Document("Document.docx");

// Ottieni tutte le forme
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;

// Passa attraverso la collezione di forme
for (Shape shape : shapes) {
  
    // Controlla se la forma ha un'immagine
    if (shape.hasImage()) {
      
        // Estrai e salva l'immagine
        String imageFileName = String.format(
                "Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
        shape.getImageData().save(dataDir + imageFileName);
        imageIndex++;
    }
}

Ottieni una licenza API gratuita

Ottieni una licenza temporanea gratuita per utilizzare Aspose.Words per Java senza limitazioni di valutazione.

Conclusione

In questo articolo hai imparato come estrarre immagini da un documento Word usando Java. Inoltre, l’esempio di codice ha mostrato come estrarre le immagini da un file DOCX e salvarle nella posizione desiderata. Inoltre, Aspose.Words per Java fornisce un’ampia gamma di funzionalità per la manipolazione dei documenti. Per esplorare queste funzionalità, puoi visitare la documentazione. Inoltre, puoi porre le tue domande tramite il nostro forum.

Guarda anche

Informazioni: potresti essere interessato a un’altra API Java (Aspose.Slides for Java) che ti consente di convertire le presentazioni (in PDF, documenti word, ecc.) e importare immagini o altri documenti in presentazioni.