Bilder används ofta för att representera viktig information i Word DOC-dokument. Inkluderandet av bilder tillsammans med text gör innehållet mer tilltalande. I vissa fall kan du behöva extrahera bilderna som är inbäddade i DOC-dokumenten programmatiskt. För att uppnå det tar den här artikeln upp hur man extraherar bilder från DOC i Java.
Java API för att extrahera bilder från DOC-filer
Aspose.Words for Java är ett kraftfullt och funktionsrikt API för att skapa, manipulera och konvertera MS Word-dokument. Därför kommer vi att använda detta API för att extrahera bilder från DOC-dokument. Du kan ladda ner API:s JAR eller installera den i din Java-applikation med hjälp av följande Maven-konfigurationer.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Hur man extraherar bilder från DOC i Java
Bilderna i ett DOC-dokument representeras med formobjekt. Därför måste du bearbeta varje form i dokumentet för att hämta bilder. Följande är stegen för att extrahera bilder från en DOC-fil i Java.
- Ladda först DOC-filen med klassen Document.
- Lägg sedan alla former till en NodeCollection med hjälp av metoden Document.getChildNodes(NodeType.SHAPE, Boolean).
- Gå igenom de hämtade formerna.
- Kontrollera i varje iteration om formen har en bild med metoden Shape.hasImage().
- Extrahera till sist bilden och spara den med metoden Shape.getImageData().save(string).
Följande kodexempel visar hur man extraherar bilder från ett DOC-dokument i Java.
// Ladda Word-dokument
Document doc = new Document("Document.docx");
// Få alla former
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;
// Gå igenom formkollektionen
for (Shape shape : shapes) {
// Kontrollera om formen har bild
if (shape.hasImage()) {
// Extrahera och spara bilden
String imageFileName = String.format(
"Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
shape.getImageData().save(dataDir + imageFileName);
imageIndex++;
}
}
Java DOC Image Extractor - Skaffa en gratis licens
Få en gratis tillfällig licens för att använda Aspose.Words för Java utan utvärderingsbegränsningar.
Slutsats
I den här artikeln har du lärt dig hur du extraherar bilder från ett DOC-dokument i Java. Dessutom har kodexemplet visat hur man extraherar bilderna från en DOC-fil och sparar dem på önskad plats. Dessutom erbjuder Aspose.Words för Java ett brett utbud av funktioner för dokumentmanipulering. För att utforska dessa funktioner kan du besöka dokumentationen. Du kan också ställa dina frågor via vårt forum.
Se även
- Skapa Word-dokument från grunden i Java
- Generera Word-dokument från mallar i Java
- Konvertera Word-filer till PDF i Java
Info: Du kanske är intresserad av ett annat Java API (Aspose.Slides for Java) som låter dig konvertera presentationer (till PDF-filer, word-dokument, etc.) och importera bilder eller andra dokument till presentationer.