Видобути зображення з PDF на Java

Під час аналізу PDF-файлів вам може знадобитися витягти зображення разом із текстом із документів. Щоб виконати цю операцію програмним шляхом, у цій статті описано, як витягти зображення з PDF-файлу в Java. Покроковий посібник разом із посиланнями на API та прикладом коду демонструє повну процедуру вилучення зображення.

Бібліотека Java для вилучення зображень із PDF

Щоб отримати зображення з PDF, ми скористаємося Aspose.PDF for Java. Це потужна бібліотека для роботи з PDF-файлами, яка надає широкий спектр функцій для створення та обробки PDF-файлів. Ви можете завантажити бібліотеку або встановити її за допомогою наступної конфігурації Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>22.12</version>
</dependency>

Як витягти зображення з PDF-файлу в Java

Нижче наведено кроки, які ми виконаємо, щоб отримати зображення з файлу PDF.

  • Завантажте файл PDF.
  • Переглядайте сторінки в PDF.
  • Витягніть зображення одне за одним.
  • Збережіть витягнуті зображення.

У наступному розділі показано, як написати код для вилучення PDF-зображень у Java.

Java PDF Image Extraction

Нижче наведено кроки для отримання зображень із документа PDF за допомогою Java.

  • Завантажте PDF-документ за допомогою класу Document.
  • Переглядайте колекцію сторінок документа, повернуту методом Document.getPages().
  • Для кожної Page прокрутіть колекцію XImage, яку вона має, за допомогою методу Page.getResources().getImages().
  • Створіть об’єкт FileOutputStream, щоб зберегти кожне зображення.

У наведеному нижче прикладі коду показано вилучення зображення з PDF-файлу в Java.

// Завантажити документ PDF
Document pdfDocument = new Document("ImagetoPDF.pdf");

// Переглядайте сторінки
for (Page page : pdfDocument.getPages()) {

	int imageCounter = 1;

	// Переглядайте зображення
	for (XImage xImage : page.getResources().getImages()) {
		try {
			
			// Створити потік файлів 
			java.io.FileOutputStream outputImage = new java.io.FileOutputStream(
					page.getNumber() + "_" + imageCounter + ".jpg");
			
			// Зберегти вихідне зображення
			xImage.save(outputImage);
			
			// Закрийте потік
			outputImage.close();
		} catch (java.io.FileNotFoundException e) {
			// TODO: обробка винятку
			e.printStackTrace();
		} catch (java.io.IOException e) {
			// TODO: обробка винятку
			e.printStackTrace();
		}
		
		imageCounter++;
	}
	
	// Скинути лічильник
	imageCounter=1;
}

Безкоштовне вилучення зображень PDF Java

Ви можете отримати безкоштовну тимчасову ліцензію, щоб видобувати зображення з PDF без будь-яких обмежень.

Дослідіть бібліотеку Java PDF

Ви можете дізнатися більше про бібліотеку Java PDF за допомогою документації. Також ви можете опублікувати свої запити на нашому форумі.

Висновок

У різних випадках зображення потрібно витягти з документів PDF. Отже, у цій статті ви дізналися, як видобувати зображення з файлів PDF у Java. Ми продемонстрували, як легко обробити PDF-файл, а потім витягнути зображення за кілька простих кроків. Ви можете легко інтегрувати наданий зразок коду у ваші програми та виконати вилучення зображень PDF.

Дивись також