Bild aus PDF in Java extrahieren

Beim Analysieren der PDF Dateien müssen Sie möglicherweise Bilder zusammen mit Text aus den Dokumenten extrahieren. Um diesen Vorgang programmgesteuert auszuführen, behandelt dieser Artikel das Extrahieren von Bildern aus PDF Dokumenten in Java. Die Schritt-für-Schritt-Anleitung zusammen mit API-Referenzen und Codebeispielen demonstrieren das vollständige Bildextraktionsverfahren.

Java API zum Extrahieren von Bildern aus PDF – kostenloser Download

Um Bilder aus PDF zu extrahieren, verwenden wir Aspose.PDF for Java. Es ist eine leistungsstarke PDF-Manipulations-API, die eine breite Palette von Funktionen zum Erstellen und Verarbeiten von PDF Dateien bietet. Sie können die API entweder herunterladen oder sie mit der folgenden Maven-Konfiguration installieren.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>21.5</version>
</dependency>

Extrahieren von Bildern aus einem PDF in Java

Im Folgenden sind die Schritte zum Extrahieren von Bildern aus einem PDF Dokument mit Java aufgeführt.

Das folgende Codebeispiel zeigt, wie Bilder aus einem PDF Dokument extrahiert werden.

// PDF Dokument laden
Document pdfDocument = new Document("ImagetoPDF.pdf");

// Durch die Seiten blättern
for (Page page : pdfDocument.getPages()) {

	int imageCounter = 1;

	// Schleife durch Bilder
	for (XImage xImage : page.getResources().getImages()) {
		try {
			
			// Dateistream erstellen 
			java.io.FileOutputStream outputImage = new java.io.FileOutputStream(
					page.getNumber() + "_" + imageCounter + ".jpg");
			
			// Ausgabebild speichern
			xImage.save(outputImage);
			
			// Schließen Sie den Stream
			outputImage.close();
		} catch (java.io.FileNotFoundException e) {
			// TODO: Ausnahme behandeln
			e.printStackTrace();
		} catch (java.io.IOException e) {
			// TODO: Ausnahme behandeln
			e.printStackTrace();
		}
		
		imageCounter++;
	}
	
	// Zähler zurücksetzen
	imageCounter=1;
}

Java PDF Image Extractor - Holen Sie sich eine kostenlose Lizenz

Sie können Aspose.PDF for Java ohne Evaluierungseinschränkungen mit einer temporären Lizenz verwenden.

Fazit

In verschiedenen Fällen müssen Bilder aus PDF Dokumenten extrahiert werden. Um dies zu erreichen, haben Sie in diesem Artikel gelernt, wie Sie Bilder aus PDF Dateien in Java extrahieren. Weitere Informationen zur Java PDF API finden Sie in der Dokumentation. Außerdem können Sie Ihre Fragen in unserem Forum posten.

Siehe auch