Extrahieren Sie Bilder aus Word Dokumenten mit Java

Bilder werden häufig verwendet, um wichtige Informationen in Word-DOC Dokumenten darzustellen. Die Einbindung von Bildern neben Text macht den Inhalt ansprechender. In bestimmten Fällen müssen Sie möglicherweise die in die DOC Dokumente eingebetteten Bilder programmgesteuert extrahieren. Um dies zu erreichen, behandelt dieser Artikel das Extrahieren von Bildern aus DOC in Java.

Java-API zum Extrahieren von Bildern aus DOC Dateien

Aspose.Words for Java ist eine leistungsstarke und funktionsreiche API zum Erstellen, Bearbeiten und Konvertieren von MS Word Dokumenten. Daher werden wir diese API verwenden, um Bilder aus DOC Dokumenten zu extrahieren. Sie können die JAR-Datei der API herunterladen oder sie mit den folgenden Maven-Konfigurationen in Ihrer Java-Anwendung installieren.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

So extrahieren Sie Bilder aus einem DOC in Java

Die Bilder in einem DOC Dokument werden mithilfe von Formobjekten dargestellt. Um Bilder abzurufen, müssen Sie daher jede Form im Dokument verarbeiten. Im Folgenden sind die Schritte zum Extrahieren von Bildern aus einer DOC-Datei in Java aufgeführt.

Das folgende Codebeispiel zeigt, wie Bilder aus einem DOC Dokument in Java extrahiert werden.

// Word Dokument laden
Document doc = new Document("Document.docx");

// Holen Sie sich alle Formen
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;

// Durchlaufen Sie die Formensammlung
for (Shape shape : shapes) {
  
    // Überprüfen Sie, ob die Form ein Bild hat
    if (shape.hasImage()) {
      
        // Extrahieren und speichern Sie das Bild
        String imageFileName = String.format(
                "Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
        shape.getImageData().save(dataDir + imageFileName);
        imageIndex++;
    }
}

Java Image Extractor for DOC - Holen Sie sich eine kostenlose API Lizenz

Holen Sie sich eine kostenlose temporäre Lizenz, um Aspose.Words for Java ohne Evaluierungseinschränkungen zu verwenden.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie Bilder aus einem DOC Dokument in Java extrahieren. Darüber hinaus hat das Codebeispiel gezeigt, wie die Bilder aus einer DOC-Datei extrahiert und an der gewünschten Stelle gespeichert werden. Außerdem bietet Aspose.Words for Java eine breite Palette von Funktionen zur Dokumentenbearbeitung. Um diese Funktionen zu erkunden, können Sie die Dokumentation besuchen. Sie können Ihre Fragen auch über unser Forum stellen.

Siehe auch

Info: Möglicherweise interessieren Sie sich für eine andere Java-API (Aspose.Slides for Java), mit der Sie Präsentationen konvertieren (in PDFs, Word Dokumente usw.) und Bilder importieren oder andere Dokumente in Präsentationen.