Ekstrak Gambar dari PDF Python

Jika Anda mencari metode langsung untuk mengekstrak gambar dari PDF menggunakan Python, artikel ini memberikan solusi yang berharga. Dengan mengikuti beberapa langkah sederhana, Anda dapat mempelajari cara memproses file PDF secara efisien dan mengekstrak gambarnya. Jadi mari kita lihat cara mengekstrak gambar dari file PDF dengan Python.

Perpustakaan Python untuk Mengekstrak Gambar dalam PDF

Untuk mengekstrak gambar dari PDF, kami akan menggunakan Anggap.PDF untuk Python. Ini adalah perpustakaan PDF yang kuat yang memungkinkan Anda membuat dan memproses file PDF dengan mudah. Selain itu, ini memungkinkan Anda mengurai PDF dan mengekstrak gambar dalam beberapa baris kode. Gunakan perintah pip berikut untuk menginstal library di aplikasi Anda.

> pip install aspose-pdf 

Cara Mengekstrak Gambar dari PDF dengan Python

Berikut ini adalah langkah-langkah yang akan kita ikuti untuk mengekstrak gambar dari file PDF.

  • Muat file PDF.
  • Ulangi halaman-halaman di PDF.
  • Ekstrak gambar satu per satu.
  • Simpan gambar yang diekstraksi.

Sekarang mari ubah langkah-langkah ini menjadi kode Python dan ekstrak gambar dari PDF.

Ekstraksi Gambar PDF dengan Python

Berikut ini adalah langkah-langkah untuk mengekstrak gambar dari PDF dengan Python.

  • Pertama, muat PDF menggunakan kelas Document.
  • Ulangi halaman-halaman PDF menggunakan koleksi document.pages.
  • Untuk setiap halaman, akses setiap XImage di koleksi resources.images.
  • Simpan setiap gambar ke lokasi yang diinginkan menggunakan metode XImage.save().

Contoh kode berikut menunjukkan cara mengekstrak gambar dari PDF dengan Python.

import aspose.pdf as ap
import aspose.pydrawing as drawing

# Muat PDF
document = ap.Document("document.pdf")

image_counter = 1
image_name = "image_{counter}.jpg"

# Ulangi semua halaman
for page in document.pages:

    # Ulangi gambar di halaman
   for image in page.resources.images: 
        
        # Buat objek aliran memori untuk menyimpan gambar
        with open(image_name.format(counter=image_counter), "wb") as stream:
           
            # Simpan gambar
            image.save(stream, drawing.imaging.ImageFormat.jpeg)
            image_counter = image_counter + 1

Ekstraktor Gambar PDF Online

Kami juga menyediakan parser PDF online, yang didasarkan pada Aspose.PDF for Python. Anda dapat menggunakan alat gratis ini untuk mengurai file PDF dan mengekstrak gambar.

Perpustakaan PDF Python

Anda bisa mendapatkan lisensi sementara gratis dan mengekstrak gambar dari file PDF tanpa batasan apa pun.

Selain itu, Anda dapat mempelajari lebih lanjut tentang pustaka Python PDF menggunakan dokumentasi. Selain itu, Anda dapat memposting pertanyaan Anda di forum kami.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengekstrak gambar dari PDF dengan Python. Panduan langkah demi langkah dan contoh kode telah menunjukkan cara mengurai PDF dan mengekstrak gambar dari setiap halaman. Selain itu, kami telah memberi Anda aplikasi online gratis untuk teks PDF dan ekstraksi gambar. Anda dapat menggunakan aplikasi ini dari perangkat apa pun yang memiliki koneksi internet.

Lihat juga