استخراج تصاویر از PDF Python

اگر به دنبال روشی ساده برای استخراج تصاویر از PDF با استفاده از پایتون هستید، این مقاله راه حل ارزشمندی را ارائه می دهد. با انجام چند مرحله ساده، می توانید یاد بگیرید که چگونه یک فایل PDF را به طور موثر پردازش کنید و تصاویر آن را استخراج کنید. پس بیایید ببینیم چگونه تصاویر را از یک فایل PDF در پایتون استخراج کنیم.

کتابخانه پایتون برای استخراج تصاویر در PDF

برای استخراج تصاویر از PDF، از Aspose.PDF for Python استفاده خواهیم کرد. این یک کتابخانه PDF قوی است که به شما امکان می دهد فایل های PDF را بدون زحمت ایجاد و پردازش کنید. علاوه بر این، به شما امکان می دهد PDF را تجزیه و تصاویر را در چند خط کد استخراج کنید. از دستور pip زیر برای نصب کتابخانه در برنامه خود استفاده کنید.

> pip install aspose-pdf 

نحوه استخراج تصاویر از PDF در پایتون

مراحل زیر برای استخراج تصاویر از یک فایل PDF انجام می شود.

  • فایل PDF را بارگیری کنید.
  • صفحات را در PDF حلقه بزنید.
  • تصاویر را یکی یکی استخراج کنید.
  • تصاویر استخراج شده را ذخیره کنید.

حالا بیایید این مراحل را به کد پایتون تبدیل کنیم و تصاویر را از PDF استخراج کنیم.

استخراج تصویر PDF در پایتون

در زیر مراحل استخراج تصاویر از PDF در پایتون آمده است.

  • ابتدا PDF را با استفاده از کلاس Document بارگذاری کنید.
  • با استفاده از مجموعه document.pages صفحات PDF را مرور کنید.
  • برای هر صفحه، به هر XImage در مجموعه resources.images دسترسی داشته باشید.
  • با استفاده از متد ()XImage.save هر تصویر را در محل مورد نظر ذخیره کنید.

نمونه کد زیر نحوه استخراج تصاویر از PDF در پایتون را نشان می دهد.

import aspose.pdf as ap
import aspose.pydrawing as drawing

# PDF را بارگیری کنید
document = ap.Document("document.pdf")

image_counter = 1
image_name = "image_{counter}.jpg"

# تمام صفحات را حلقه بزنید
for page in document.pages:

    # از طریق تصاویر در صفحه حلقه بزنید
   for image in page.resources.images: 
        
        # برای ذخیره تصویر یک شی جریان حافظه ایجاد کنید
        with open(image_name.format(counter=image_counter), "wb") as stream:
           
            # تصویر را ذخیره کنید
            image.save(stream, drawing.imaging.ImageFormat.jpeg)
            image_counter = image_counter + 1

استخراج کننده تصویر PDF آنلاین

ما همچنین یک تجزیه‌کننده آنلاین PDF ارائه می‌کنیم که بر اساس Aspose.PDF برای پایتون است. شما می توانید از این ابزار رایگان برای تجزیه فایل های PDF و استخراج تصاویر استفاده کنید.

کتابخانه PDF پایتون

می توانید یک [مجوز موقت رایگان] دریافت کنید و بدون هیچ محدودیتی تصاویر را از فایل های PDF استخراج کنید.

علاوه بر این، می توانید با استفاده از مستندات اطلاعات بیشتری در مورد کتابخانه PDF Python کاوش کنید. همچنین، می‌توانید سوالات خود را در [فروم 12 ما ارسال کنید.

نتیجه

در این مقاله نحوه استخراج تصاویر از PDF در پایتون را یاد گرفتید. راهنمای گام به گام و نمونه کد نحوه تجزیه یک PDF و استخراج تصاویر از هر صفحه را نشان داده است. علاوه بر این، ما یک برنامه آنلاین رایگان برای استخراج متن و تصویر PDF در اختیار شما قرار داده ایم. می توانید از هر دستگاهی که به اینترنت متصل است از این برنامه استفاده کنید.

همچنین ببینید