استخراج تصویر از PDF در جاوا

هنگام تجزیه فایل‌های PDF، ممکن است لازم باشد تصاویر را به همراه متن از اسناد استخراج کنید. به منظور انجام این عملیات به صورت برنامه ای، این مقاله نحوه استخراج تصاویر از اسناد PDF در جاوا را پوشش می دهد. راهنمای گام به گام همراه با مراجع API و نمونه کد، روند کامل استخراج تصویر را نشان می دهد.

Java API برای استخراج تصاویر از PDF - دانلود رایگان

برای استخراج تصاویر از PDF، از Aspose.PDF برای جاوا استفاده می کنیم. این یک API دستکاری PDF قدرتمند است که طیف گسترده ای از ویژگی ها را برای ایجاد و پردازش فایل های PDF فراهم می کند. می توانید API را دانلود یا با استفاده از پیکربندی Maven زیر نصب کنید.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>21.5</version>
</dependency>

استخراج تصاویر از PDF در جاوا

در زیر مراحل استخراج تصاویر از یک سند PDF با استفاده از جاوا آمده است.

  • سند PDF را با استفاده از کلاس Document بارگیری کنید.
  • از طریق مجموعه صفحات سند بازگردانده شده با روش Document.getPages() تکرار کنید.
  • برای هر Page، با استفاده از روش Page.getResources().getImages() مجموعه XImage را که دارد حلقه بزنید.
  • برای ذخیره هر تصویر یک شی از FileOutputStream ایجاد کنید.

نمونه کد زیر نحوه استخراج تصاویر از یک سند PDF را نشان می دهد.

// سند PDF را بارگیری کنید
Document pdfDocument = new Document("ImagetoPDF.pdf");

// از طریق صفحات حلقه بزنید
for (Page page : pdfDocument.getPages()) {

	int imageCounter = 1;

	// حلقه بین تصاویر
	for (XImage xImage : page.getResources().getImages()) {
		try {
			
			// جریان فایل ایجاد کنید 
			java.io.FileOutputStream outputImage = new java.io.FileOutputStream(
					page.getNumber() + "_" + imageCounter + ".jpg");
			
			// ذخیره تصویر خروجی
			xImage.save(outputImage);
			
			// جریان را ببندید
			outputImage.close();
		} catch (java.io.FileNotFoundException e) {
			// TODO: رسیدگی به استثنا
			e.printStackTrace();
		} catch (java.io.IOException e) {
			// TODO: رسیدگی به استثنا
			e.printStackTrace();
		}
		
		imageCounter++;
	}
	
	// تنظیم مجدد شمارنده
	imageCounter=1;
}

Java PDF Image Extractor - مجوز رایگان دریافت کنید

می‌توانید از Aspose.PDF برای جاوا بدون محدودیت ارزیابی با استفاده از مجوز موقت استفاده کنید.

نتیجه

در موارد مختلف، نیاز به استخراج تصاویر از اسناد PDF است. برای رسیدن به این هدف، در این مقاله نحوه استخراج تصاویر از فایل های PDF در جاوا را یاد گرفتید. می‌توانید با استفاده از مستندات درباره Java PDF API بیشتر کاوش کنید. همچنین، می توانید سوالات خود را در [فروم 11 ما ارسال کنید.

همچنین ببینید