Як витягти зображення з PDF на Java

Під час аналізу PDF-файлів вам може знадобитися витягти зображення разом із текстом із документів. Щоб виконати цю операцію програмним шляхом, у цій статті описано, як витягти зображення з PDF-файлу в Java. Покроковий посібник разом із посиланнями на API та прикладом коду демонструє повну процедуру вилучення зображення.

Бібліотека Java для вилучення зображень у PDF
Видобування зображень із PDF-файлу в Java

Бібліотека Java для вилучення зображень із PDF

Щоб отримати зображення з PDF, ми скористаємося Aspose.PDF for Java. Це потужна бібліотека для роботи з PDF-файлами, яка надає широкий спектр функцій для створення та обробки PDF-файлів. Ви можете завантажити бібліотеку або встановити її за допомогою наступної конфігурації Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>22.12</version>
</dependency>

Як витягти зображення з PDF-файлу в Java

Нижче наведено кроки, які ми виконаємо, щоб отримати зображення з файлу PDF.

Завантажте файл PDF.
Переглядайте сторінки в PDF.
Витягніть зображення одне за одним.
Збережіть витягнуті зображення.

У наступному розділі показано, як написати код для вилучення PDF-зображень у Java.

Java PDF Image Extraction

Нижче наведено кроки для отримання зображень із документа PDF за допомогою Java.

Завантажте PDF-документ за допомогою класу Document.
Переглядайте колекцію сторінок документа, повернуту методом Document.getPages().
Для кожної Page прокрутіть колекцію XImage, яку вона має, за допомогою методу Page.getResources().getImages().
Створіть об’єкт FileOutputStream, щоб зберегти кожне зображення.

У наведеному нижче прикладі коду показано вилучення зображення з PDF-файлу в Java.

// Завантажити документ PDF
Document pdfDocument = new Document("ImagetoPDF.pdf");

// Переглядайте сторінки
for (Page page : pdfDocument.getPages()) {

	int imageCounter = 1;

	// Переглядайте зображення
	for (XImage xImage : page.getResources().getImages()) {
		try {
			
			// Створити потік файлів 
			java.io.FileOutputStream outputImage = new java.io.FileOutputStream(
					page.getNumber() + "_" + imageCounter + ".jpg");
			
			// Зберегти вихідне зображення
			xImage.save(outputImage);
			
			// Закрийте потік
			outputImage.close();
		} catch (java.io.FileNotFoundException e) {
			// TODO: обробка винятку
			e.printStackTrace();
		} catch (java.io.IOException e) {
			// TODO: обробка винятку
			e.printStackTrace();
		}
		
		imageCounter++;
	}
	
	// Скинути лічильник
	imageCounter=1;
}

Безкоштовне вилучення зображень PDF Java

Ви можете отримати безкоштовну тимчасову ліцензію, щоб видобувати зображення з PDF без будь-яких обмежень.

Дослідіть бібліотеку Java PDF

Ви можете дізнатися більше про бібліотеку Java PDF за допомогою документації. Також ви можете опублікувати свої запити на нашому форумі.

Висновок

У різних випадках зображення потрібно витягти з документів PDF. Отже, у цій статті ви дізналися, як видобувати зображення з файлів PDF у Java. Ми продемонстрували, як легко обробити PDF-файл, а потім витягнути зображення за кілька простих кроків. Ви можете легко інтегрувати наданий зразок коду у ваші програми та виконати вилучення зображень PDF.

Бібліотека Java для вилучення зображень із PDF#

Як витягти зображення з PDF-файлу в Java#

Java PDF Image Extraction#

Безкоштовне вилучення зображень PDF Java#

Дослідіть бібліотеку Java PDF#

Висновок#

Дивись також#