Estrai immagini da documenti Word utilizzando Java

Le immagini sono comunemente usate per rappresentare informazioni importanti nei documenti Word DOC. L’inclusione di immagini accanto al testo rende il contenuto più accattivante. In alcuni casi, potrebbe essere necessario estrarre le immagini incorporate nei documenti DOC in modo programmatico. Per raggiungere questo obiettivo, questo articolo spiega come estrarre immagini da DOC in Java.

API Java per estrarre immagini da file DOC

Aspose.Words for Java è un’API potente e ricca di funzionalità per la creazione, la manipolazione e la conversione di documenti MS Word. Pertanto, utilizzeremo questa API per estrarre immagini da documenti DOC. Puoi scaricare il JAR dell’API o installarlo nella tua applicazione Java utilizzando le seguenti configurazioni Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Come estrarre immagini da un DOC in Java

Le immagini in un documento DOC sono rappresentate utilizzando oggetti forma. Pertanto, per recuperare le immagini, dovrai elaborare ogni forma nel documento. Di seguito sono riportati i passaggi per estrarre le immagini da un file DOC in Java.

L’esempio di codice seguente mostra come estrarre immagini da un documento DOC in Java.

// Carica documento Word
Document doc = new Document("Document.docx");

// Ottieni tutte le forme
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;

// Passa attraverso la collezione di forme
for (Shape shape : shapes) {
  
    // Controlla se la forma ha un'immagine
    if (shape.hasImage()) {
      
        // Estrai e salva l'immagine
        String imageFileName = String.format(
                "Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
        shape.getImageData().save(dataDir + imageFileName);
        imageIndex++;
    }
}

Java Image Extractor per DOC - Ottieni una licenza API gratuita

Ottieni una licenza temporanea gratuita per utilizzare Aspose.Words per Java senza limitazioni di valutazione.

Conclusione

In questo articolo hai imparato come estrarre immagini da un documento DOC in Java. Inoltre, l’esempio di codice ha mostrato come estrarre le immagini da un file DOC e salvarle nella posizione desiderata. Inoltre, Aspose.Words per Java fornisce un’ampia gamma di funzionalità per la manipolazione dei documenti. Per esplorare queste funzionalità, puoi visitare la documentazione. Inoltre, puoi porre le tue domande tramite il nostro forum.

Guarda anche

Informazioni: potresti essere interessato a un’altra API Java (Aspose.Slides for Java) che ti consente di convertire le presentazioni (in PDF, documenti word, ecc.) e importare immagini o altri documenti in presentazioni.