Як витягти зображення з PDF-файлу на Python

Якщо ви шукаєте простий спосіб вилучення зображень із PDF за допомогою Python, ця стаття пропонує цінне рішення. Дотримуючись кількох простих кроків, ви зможете навчитися ефективно обробляти PDF-файл і видобувати його зображення. Отже, давайте подивимося, як витягти зображення з PDF-файлу в Python.

Бібліотека Python для вилучення зображень із PDF
Видобування зображень із PDF на Python
Онлайн-екстрактор зображень PDF

Бібліотека Python для вилучення зображень у PDF

Щоб отримати зображення з PDF-файлу, ми будемо використовувати Aspose.PDF for Python. Це надійна бібліотека PDF, яка дозволяє легко створювати та обробляти PDF-файли. Крім того, він дозволяє аналізувати PDF-файл і видобувати зображення за допомогою кількох рядків коду. Використовуйте наступну команду pip, щоб установити бібліотеку у своїй програмі.

> pip install aspose-pdf

Як витягти зображення з PDF-файлу на Python

Нижче наведено кроки, які ми виконаємо, щоб отримати зображення з файлу PDF.

Завантажте файл PDF.
Переглядайте сторінки в PDF.
Витягніть зображення одне за одним.
Збережіть витягнуті зображення.

Давайте тепер перетворимо ці кроки в код Python і витягнемо зображення з PDF-файлу.

Видобування зображень PDF у Python

Нижче наведено кроки для отримання зображень із PDF-файлу в Python.

Спочатку завантажте PDF за допомогою класу Document.
Переглядайте сторінки PDF-файлу за допомогою колекції document.pages.
Для кожної сторінки отримайте доступ до кожного XImage у колекції resources.images.
Збережіть кожне зображення в потрібному місці за допомогою методу XImage.save().

У наведеному нижче прикладі коду показано, як видобувати зображення з PDF-файлу в Python.

import aspose.pdf as ap
import aspose.pydrawing as drawing

# Завантажте PDF
document = ap.Document("document.pdf")

image_counter = 1
image_name = "image_{counter}.jpg"

# Перегляньте всі сторінки
for page in document.pages:

    # Переглядайте зображення на сторінці
   for image in page.resources.images: 
        
        # Створіть об’єкт потоку пам’яті для збереження зображення
        with open(image_name.format(counter=image_counter), "wb") as stream:
           
            # Збережіть зображення
            image.save(stream, drawing.imaging.ImageFormat.jpeg)
            image_counter = image_counter + 1

Онлайн-екстрактор зображень PDF

Ми також надаємо онлайн-парсер PDF, який базується на Aspose.PDF for Python. Ви можете використовувати цей безкоштовний інструмент для аналізу PDF-файлів і вилучення зображень.

Бібліотека Python PDF

Ви можете отримати безкоштовну тимчасову ліцензію і видобувати зображення з PDF-файлів без будь-яких обмежень.

Крім того, ви можете дізнатися більше про бібліотеку PDF Python за допомогою документації. Також ви можете опублікувати свої запити на нашому форумі.

Висновок

У цій статті ви дізналися, як видобувати зображення з PDF-файлу на Python. У покроковому посібнику та прикладі коду показано, як аналізувати PDF-файл і витягувати зображення з кожної сторінки. Крім того, ми надали вам безкоштовну онлайн-програму для видобування тексту PDF і зображень. Ви можете використовувати цю програму з будь-якого пристрою, підключеного до Інтернету.

Бібліотека Python для вилучення зображень у PDF#

Як витягти зображення з PDF-файлу на Python#

Видобування зображень PDF у Python#

Онлайн-екстрактор зображень PDF#

Бібліотека Python PDF#

Висновок#

Дивись також#

Бібліотека Python для вилучення зображень у PDF

Як витягти зображення з PDF-файлу на Python

Видобування зображень PDF у Python

Онлайн-екстрактор зображень PDF

Бібліотека Python PDF

Висновок

Дивись також