
Bilder werden häufig verwendet, um wichtige Informationen in Word Dokumenten darzustellen. Die Einbindung von Bildern neben Text macht den Inhalt ansprechender. In bestimmten Fällen müssen Sie möglicherweise die in die Word Dokumente eingebetteten Bilder programmgesteuert extrahieren. Um dies zu erreichen, behandelt dieser Artikel das Extrahieren von Bildern aus Word Dokumenten mit Java.
Java API zum Extrahieren von Bildern aus Word Dokumenten
Aspose.Words for Java ist eine leistungsstarke und funktionsreiche API zum Erstellen, Bearbeiten und Konvertieren von MS Word Dokumenten. Daher werden wir diese API verwenden, um Bilder aus MS Word DOCX/DOC Dokumenten zu extrahieren. Sie können die JAR Datei der API herunterladen oder sie mit den folgenden Maven konfigurationen in Ihrer Java Anwendung installieren.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
So extrahieren Sie Bilder aus einem Word Dokument
Die Bilder in einem Word Dokument werden mithilfe von Formobjekten dargestellt. Um Bilder abzurufen, müssen Sie daher jede Form im Dokument verarbeiten. Im Folgenden sind die Schritte zum Extrahieren von Bildern aus einem Word-DOCX-Dokument in Java aufgeführt.
- Laden Sie zuerst die Word Datei mit der Klasse Document.
- Holen Sie dann alle Formen in eine NodeCollection objekt mit der methode Document.getChildNodes(NodeType.SHAPE, Boolean).
- Durchlaufen Sie die abgerufenen Formen.
- Überprüfen Sie bei jeder Iteration, ob die Form ein Bild hat, indem Sie die Methode Shape.hasImage() verwenden.
- Extrahieren Sie abschließend das Bild und speichern Sie es mit der methode Shape.getImageData().save(string).
Das folgende Codebeispiel zeigt, wie Bilder aus einem DOCX-Dokument in Java extrahiert werden.
// Word Dokument laden
Document doc = new Document("Document.docx");
// Holen Sie sich alle Formen
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;
// Durchlaufen Sie die Formensammlung
for (Shape shape : shapes) {
// Überprüfen Sie, ob die Form ein Bild hat
if (shape.hasImage()) {
// Extrahieren und speichern Sie das Bild
String imageFileName = String.format(
"Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
shape.getImageData().save(dataDir + imageFileName);
imageIndex++;
}
}
Holen Sie sich eine kostenlose API Lizenz
Holen Sie sich eine kostenlose temporäre Lizenz, um Aspose.Words for Java ohne Evaluierungseinschränkungen zu verwenden.
Fazit
In diesem Artikel haben Sie gelernt, wie Sie mit Java Bilder aus einem Word Dokument extrahieren. Darüber hinaus hat das Codebeispiel gezeigt, wie Sie die Bilder aus einer DOCX Datei extrahieren und am gewünschten Ort speichern können. Außerdem bietet Aspose.Words for Java eine breite Palette von Funktionen zur Dokumentenbearbeitung. Um diese Funktionen zu erkunden, können Sie die Dokumentation besuchen. Sie können Ihre Fragen auch über unser Forum stellen.
Siehe auch
- Erstellen Sie Word Dokumente von Grund auf neu in Java
- Erstellen Sie Word Dokumente aus Vorlagen in Java
- Konvertieren Sie Word Dateien in PDF in Java
Info: Möglicherweise interessieren Sie sich für eine andere Java API (Aspose.Slides for Java), mit der Sie Präsentationen konvertieren (in PDFs, Word Dokumente usw.) und Bilder importieren oder andere Dokumente in Präsentationen.