Diviser un fichier PDF en plusieurs fichiers à l'aide de Python

À l’ère numérique d’aujourd’hui, les fichiers PDF sont devenus une partie essentielle de nos vies. Cependant, nous pouvons parfois avoir besoin de diviser un fichier PDF volumineux en fichiers plus petits pour diverses raisons, telles que l’envoi de pages spécifiques à quelqu’un ou leur téléchargement sur un site Web. Une situation similaire peut se présenter lors du traitement de fichiers PDF en Python. Ainsi dans cet article, nous allons voir comment scinder un fichier PDF en Python. Nous verrons comment diviser les PDF par page ou par ensemble de pages.

Bibliothèque Python pour diviser un PDF

Pour diviser les fichiers PDF, nous utiliserons Aspose.PDF for Python. Il s’agit d’une bibliothèque de manipulation de PDF riche en fonctionnalités qui vous permet de créer, de modifier et de traiter des documents PDF de manière transparente. Utilisez la commande pip suivante pour installer la bibliothèque dans votre application Python.

pip install aspose-pdf

Diviser un PDF par page en Python

Vous pouvez avoir besoin de différents critères de fractionnement de PDF dans chaque situation, par exemple, fractionner chaque page dans un PDF, des pages sélectives uniquement, des pages paires uniquement, etc. Voyons d’abord comment diviser un PDF par page en Python. Vous trouverez ci-dessous les étapes pour effectuer cette opération.

  • Chargez le fichier PDF à l’aide de la classe Document.
  • Parcourez les pages de la collection Document.pages.
  • À chaque itération, effectuez les étapes suivantes :
    • Créez un nouvel objet Document et ajoutez la page au document à l’aide de la méthode Document.pages.add(Page).
    • Enregistrez le fichier PDF à l’aide de la méthode Document.save().

L’exemple de code suivant montre comment diviser chaque page d’un PDF à l’aide de Python.

import aspose.pdf as ap

# Charger le fichier PDF
document = ap.Document("input.pdf")

# Boucle sur chaque page
for page in document.pages:
    # Créer un nouveau PDF
    splitPDF = ap.Document()

    # Ajouter une page au PDF
    splitPDF.pages.add(page)

    # Enregistrez le PDF
    splitPDF.save("Page_" + str(page.number) + ".pdf")

Diviser des pages spécifiques de PDF en Python

Voyons maintenant comment diviser plusieurs pages dans un PDF et les enregistrer dans un fichier séparé. Voici les étapes pour diviser plusieurs pages PDF en Python.

  • Chargez le fichier PDF à l’aide de la classe Document.
  • Créez un nouvel objet Document pour le nouveau fichier PDF.
  • Parcourez les pages de la collection Document.pages.
  • À chaque itération, vérifiez si la page doit être fractionnée.
  • Ajoutez une page au nouveau document PDF à l’aide de la méthode Document.pages.add(Page).
  • Enfin, enregistrez le fichier PDF en utilisant la méthode Document.save().

L’exemple de code suivant montre comment fractionner une collection de pages dans un PDF à l’aide de Python.

import aspose.pdf as ap

# Charger le fichier PDF
document = ap.Document("input.pdf")

# Créer un nouveau PDF
splitPDF = ap.Document()

# Boucle sur chaque page
for page in document.pages:
    # Quelques conditions ici
    if page.number%2==0:
        # Ajouter une page
        splitPDF.pages.add(page)

# Enregistrez le PDF
splitPDF.save("Split_PDF.pdf")

Fractionner des fichiers PDF en ligne

Nous fournissons également un outil en ligne gratuit pour fractionner des fichiers PDF, qui est basé sur Aspose.PDF for Python.

Bibliothèque PDF Python gratuite

Vous pouvez obtenir une licence temporaire gratuite pour diviser des fichiers PDF sans aucune limitation. Vous pouvez également consulter la documentation pour en savoir plus sur la bibliothèque Python PDF.

Conclusion

Dans cet article, vous avez appris à diviser les fichiers PDF en Python. Vous avez vu comment diviser chaque page ou une collection de pages dans un PDF pour séparer les fichiers. Vous pouvez facilement suivre les étapes et les exemples de code fournis pour diviser les fichiers PDF dans votre application Python.

Voir également