Bilder werden häufig verwendet, um wichtige Informationen in Word-DOC Dokumenten darzustellen. Die Einbindung von Bildern neben Text macht den Inhalt ansprechender. In bestimmten Fällen müssen Sie möglicherweise die in die DOC Dokumente eingebetteten Bilder programmgesteuert extrahieren. Um dies zu erreichen, behandelt dieser Artikel das Extrahieren von Bildern aus DOC in Java.
Java-API zum Extrahieren von Bildern aus DOC Dateien
Aspose.Words for Java ist eine leistungsstarke und funktionsreiche API zum Erstellen, Bearbeiten und Konvertieren von MS Word Dokumenten. Daher werden wir diese API verwenden, um Bilder aus DOC Dokumenten zu extrahieren. Sie können die JAR-Datei der API herunterladen oder sie mit den folgenden Maven-Konfigurationen in Ihrer Java-Anwendung installieren.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
So extrahieren Sie Bilder aus einem DOC in Java
Die Bilder in einem DOC Dokument werden mithilfe von Formobjekten dargestellt. Um Bilder abzurufen, müssen Sie daher jede Form im Dokument verarbeiten. Im Folgenden sind die Schritte zum Extrahieren von Bildern aus einer DOC-Datei in Java aufgeführt.
- Laden Sie zuerst die DOC-Datei mit der Klasse Document.
- Holen Sie dann alle Formen in eine NodeCollection -Objekt mit der Methode Document.getChildNodes(NodeType.SHAPE, Boolean).
- Durchlaufen Sie die abgerufenen Formen.
- Überprüfen Sie bei jeder Iteration, ob die Form ein Bild hat, indem Sie die Methode Shape.hasImage() verwenden.
- Extrahieren Sie abschließend das Bild und speichern Sie es mit der Methode Shape.getImageData().save(string).
Das folgende Codebeispiel zeigt, wie Bilder aus einem DOC Dokument in Java extrahiert werden.
// Word Dokument laden
Document doc = new Document("Document.docx");
// Holen Sie sich alle Formen
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;
// Durchlaufen Sie die Formensammlung
for (Shape shape : shapes) {
// Überprüfen Sie, ob die Form ein Bild hat
if (shape.hasImage()) {
// Extrahieren und speichern Sie das Bild
String imageFileName = String.format(
"Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
shape.getImageData().save(dataDir + imageFileName);
imageIndex++;
}
}
Java Image Extractor for DOC - Holen Sie sich eine kostenlose API Lizenz
Holen Sie sich eine kostenlose temporäre Lizenz, um Aspose.Words for Java ohne Evaluierungseinschränkungen zu verwenden.
Fazit
In diesem Artikel haben Sie gelernt, wie Sie Bilder aus einem DOC Dokument in Java extrahieren. Darüber hinaus hat das Codebeispiel gezeigt, wie die Bilder aus einer DOC-Datei extrahiert und an der gewünschten Stelle gespeichert werden. Außerdem bietet Aspose.Words for Java eine breite Palette von Funktionen zur Dokumentenbearbeitung. Um diese Funktionen zu erkunden, können Sie die Dokumentation besuchen. Sie können Ihre Fragen auch über unser Forum stellen.
Siehe auch
- Erstellen Sie Word Dokumente von Grund auf neu in Java
- Erstellen Sie Word Dokumente aus Vorlagen in Java
- Konvertieren Sie Word Dateien in PDF in Java
Info: Möglicherweise interessieren Sie sich für eine andere Java-API (Aspose.Slides for Java), mit der Sie Präsentationen konvertieren (in PDFs, Word Dokumente usw.) und Bilder importieren oder andere Dokumente in Präsentationen.