Extrahieren Sie Bilder aus Word Dokumenten mit Java

Bilder werden häufig verwendet, um wichtige Informationen in Word Dokumenten darzustellen. Die Einbindung von Bildern neben Text macht den Inhalt ansprechender. In bestimmten Fällen müssen Sie möglicherweise die in die Word Dokumente eingebetteten Bilder programmgesteuert extrahieren. Um dies zu erreichen, behandelt dieser Artikel das Extrahieren von Bildern aus Word Dokumenten mit Java.

Java API zum Extrahieren von Bildern aus Word Dokumenten

Aspose.Words for Java ist eine leistungsstarke und funktionsreiche API zum Erstellen, Bearbeiten und Konvertieren von MS Word Dokumenten. Daher werden wir diese API verwenden, um Bilder aus MS Word DOCX/DOC Dokumenten zu extrahieren. Sie können die JAR Datei der API herunterladen oder sie mit den folgenden Maven konfigurationen in Ihrer Java Anwendung installieren.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

So extrahieren Sie Bilder aus einem Word Dokument

Die Bilder in einem Word Dokument werden mithilfe von Formobjekten dargestellt. Um Bilder abzurufen, müssen Sie daher jede Form im Dokument verarbeiten. Im Folgenden sind die Schritte zum Extrahieren von Bildern aus einem Word-DOCX-Dokument in Java aufgeführt.

Das folgende Codebeispiel zeigt, wie Bilder aus einem DOCX-Dokument in Java extrahiert werden.

// Word Dokument laden
Document doc = new Document("Document.docx");

// Holen Sie sich alle Formen
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;

// Durchlaufen Sie die Formensammlung
for (Shape shape : shapes) {
  
    // Überprüfen Sie, ob die Form ein Bild hat
    if (shape.hasImage()) {
      
        // Extrahieren und speichern Sie das Bild
        String imageFileName = String.format(
                "Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
        shape.getImageData().save(dataDir + imageFileName);
        imageIndex++;
    }
}

Holen Sie sich eine kostenlose API Lizenz

Holen Sie sich eine kostenlose temporäre Lizenz, um Aspose.Words for Java ohne Evaluierungseinschränkungen zu verwenden.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie mit Java Bilder aus einem Word Dokument extrahieren. Darüber hinaus hat das Codebeispiel gezeigt, wie Sie die Bilder aus einer DOCX Datei extrahieren und am gewünschten Ort speichern können. Außerdem bietet Aspose.Words for Java eine breite Palette von Funktionen zur Dokumentenbearbeitung. Um diese Funktionen zu erkunden, können Sie die Dokumentation besuchen. Sie können Ihre Fragen auch über unser Forum stellen.

Siehe auch

Info: Möglicherweise interessieren Sie sich für eine andere Java API (Aspose.Slides for Java), mit der Sie Präsentationen konvertieren (in PDFs, Word Dokumente usw.) und Bilder importieren oder andere Dokumente in Präsentationen.