Extrahera bilder från Word-dokument med Java

Bilder används ofta för att representera viktig information i Word DOC-dokument. Inkluderandet av bilder tillsammans med text gör innehållet mer tilltalande. I vissa fall kan du behöva extrahera bilderna som är inbäddade i DOC-dokumenten programmatiskt. För att uppnå det tar den här artikeln upp hur man extraherar bilder från DOC i Java.

Java API för att extrahera bilder från DOC-filer

Aspose.Words for Java är ett kraftfullt och funktionsrikt API för att skapa, manipulera och konvertera MS Word-dokument. Därför kommer vi att använda detta API för att extrahera bilder från DOC-dokument. Du kan ladda ner API:s JAR eller installera den i din Java-applikation med hjälp av följande Maven-konfigurationer.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Hur man extraherar bilder från DOC i Java

Bilderna i ett DOC-dokument representeras med formobjekt. Därför måste du bearbeta varje form i dokumentet för att hämta bilder. Följande är stegen för att extrahera bilder från en DOC-fil i Java.

Följande kodexempel visar hur man extraherar bilder från ett DOC-dokument i Java.

// Ladda Word-dokument
Document doc = new Document("Document.docx");

// Få alla former
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;

// Gå igenom formkollektionen
for (Shape shape : shapes) {
  
    // Kontrollera om formen har bild
    if (shape.hasImage()) {
      
        // Extrahera och spara bilden
        String imageFileName = String.format(
                "Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
        shape.getImageData().save(dataDir + imageFileName);
        imageIndex++;
    }
}

Java DOC Image Extractor - Skaffa en gratis licens

Få en gratis tillfällig licens för att använda Aspose.Words för Java utan utvärderingsbegränsningar.

Slutsats

I den här artikeln har du lärt dig hur du extraherar bilder från ett DOC-dokument i Java. Dessutom har kodexemplet visat hur man extraherar bilderna från en DOC-fil och sparar dem på önskad plats. Dessutom erbjuder Aspose.Words för Java ett brett utbud av funktioner för dokumentmanipulering. För att utforska dessa funktioner kan du besöka dokumentationen. Du kan också ställa dina frågor via vårt forum.

Se även

Info: Du kanske är intresserad av ett annat Java API (Aspose.Slides for Java) som låter dig konvertera presentationer (till PDF-filer, word-dokument, etc.) och importera bilder eller andra dokument till presentationer.