Le immagini sono comunemente usate per rappresentare informazioni importanti nei documenti Word DOC. L’inclusione di immagini accanto al testo rende il contenuto più accattivante. In alcuni casi, potrebbe essere necessario estrarre le immagini incorporate nei documenti DOC in modo programmatico. Per raggiungere questo obiettivo, questo articolo spiega come estrarre immagini da DOC in Java.
API Java per estrarre immagini da file DOC
Aspose.Words for Java è un’API potente e ricca di funzionalità per la creazione, la manipolazione e la conversione di documenti MS Word. Pertanto, utilizzeremo questa API per estrarre immagini da documenti DOC. Puoi scaricare il JAR dell’API o installarlo nella tua applicazione Java utilizzando le seguenti configurazioni Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Come estrarre immagini da un DOC in Java
Le immagini in un documento DOC sono rappresentate utilizzando oggetti forma. Pertanto, per recuperare le immagini, dovrai elaborare ogni forma nel documento. Di seguito sono riportati i passaggi per estrarre le immagini da un file DOC in Java.
- Innanzitutto, carica il file DOC utilizzando la classe Document.
- Quindi, ottieni tutte le forme in un NodeCollection utilizzando il metodo Document.getChildNodes(NodeType.SHAPE, Boolean).
- Passa attraverso le forme recuperate.
- In ogni iterazione, controlla se la forma ha un’immagine usando il metodo Shape.hasImage().
- Infine, estrai l’immagine e salvala usando il metodo Shape.getImageData().save(string).
L’esempio di codice seguente mostra come estrarre immagini da un documento DOC in Java.
// Carica documento Word
Document doc = new Document("Document.docx");
// Ottieni tutte le forme
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;
// Passa attraverso la collezione di forme
for (Shape shape : shapes) {
// Controlla se la forma ha un'immagine
if (shape.hasImage()) {
// Estrai e salva l'immagine
String imageFileName = String.format(
"Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
shape.getImageData().save(dataDir + imageFileName);
imageIndex++;
}
}
Java Image Extractor per DOC - Ottieni una licenza API gratuita
Ottieni una licenza temporanea gratuita per utilizzare Aspose.Words per Java senza limitazioni di valutazione.
Conclusione
In questo articolo hai imparato come estrarre immagini da un documento DOC in Java. Inoltre, l’esempio di codice ha mostrato come estrarre le immagini da un file DOC e salvarle nella posizione desiderata. Inoltre, Aspose.Words per Java fornisce un’ampia gamma di funzionalità per la manipolazione dei documenti. Per esplorare queste funzionalità, puoi visitare la documentazione. Inoltre, puoi porre le tue domande tramite il nostro forum.
Guarda anche
- Crea documenti Word da zero in Java
- Genera documenti Word da modelli in Java
- Converti file di Word in PDF in Java
Informazioni: potresti essere interessato a un’altra API Java (Aspose.Slides for Java) che ti consente di convertire le presentazioni (in PDF, documenti word, ecc.) e importare immagini o altri documenti in presentazioni.