Beim Analysieren der PDF Dateien müssen Sie möglicherweise Bilder zusammen mit Text aus den Dokumenten extrahieren. Um diesen Vorgang programmgesteuert auszuführen, behandelt dieser Artikel das Extrahieren von Bildern aus PDF Dokumenten in Java. Die Schritt-für-Schritt-Anleitung zusammen mit API-Referenzen und Codebeispielen demonstrieren das vollständige Bildextraktionsverfahren.
Java API zum Extrahieren von Bildern aus PDF – kostenloser Download
Um Bilder aus PDF zu extrahieren, verwenden wir Aspose.PDF for Java. Es ist eine leistungsstarke PDF-Manipulations-API, die eine breite Palette von Funktionen zum Erstellen und Verarbeiten von PDF Dateien bietet. Sie können die API entweder herunterladen oder sie mit der folgenden Maven-Konfiguration installieren.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>21.5</version>
</dependency>
Extrahieren von Bildern aus einem PDF in Java
Im Folgenden sind die Schritte zum Extrahieren von Bildern aus einem PDF Dokument mit Java aufgeführt.
- Laden Sie das PDF Dokument mit der Klasse Document.
- Durchlaufen Sie die Seitensammlung des Dokuments, das von der Methode Document.getPages() zurückgegeben wird.
- Durchlaufen Sie für jede Seite die Sammlung von XImage, die sie hat, indem Sie die Methode Page.getResources().getImages() verwenden.
- Erstellen Sie ein Objekt von FileOutputStream, um jedes Bild zu speichern.
Das folgende Codebeispiel zeigt, wie Bilder aus einem PDF Dokument extrahiert werden.
// PDF Dokument laden
Document pdfDocument = new Document("ImagetoPDF.pdf");
// Durch die Seiten blättern
for (Page page : pdfDocument.getPages()) {
int imageCounter = 1;
// Schleife durch Bilder
for (XImage xImage : page.getResources().getImages()) {
try {
// Dateistream erstellen
java.io.FileOutputStream outputImage = new java.io.FileOutputStream(
page.getNumber() + "_" + imageCounter + ".jpg");
// Ausgabebild speichern
xImage.save(outputImage);
// Schließen Sie den Stream
outputImage.close();
} catch (java.io.FileNotFoundException e) {
// TODO: Ausnahme behandeln
e.printStackTrace();
} catch (java.io.IOException e) {
// TODO: Ausnahme behandeln
e.printStackTrace();
}
imageCounter++;
}
// Zähler zurücksetzen
imageCounter=1;
}
Java PDF Image Extractor - Holen Sie sich eine kostenlose Lizenz
Sie können Aspose.PDF for Java ohne Evaluierungseinschränkungen mit einer temporären Lizenz verwenden.
Fazit
In verschiedenen Fällen müssen Bilder aus PDF Dokumenten extrahiert werden. Um dies zu erreichen, haben Sie in diesem Artikel gelernt, wie Sie Bilder aus PDF Dateien in Java extrahieren. Weitere Informationen zur Java PDF API finden Sie in der Dokumentation. Außerdem können Sie Ihre Fragen in unserem Forum posten.