Extraire des pages de Word en Python

L’extraction de pages d’un document Word en Python peut vous aider à isoler du contenu, partager des sections ou préparer des résumés. Aspose.Words for Python rend cette tâche efficace et facile. Dans cet article de blog, vous apprendrez comment extraire une ou plusieurs pages de documents Word en utilisant Python.

Nous allons aborder les sujets suivants :

Bibliothèque d’extraction de mots de page Python

Nous utiliserons Aspose.Words for Python pour extraire des pages d’un document Word. C’est une bibliothèque puissante pour l’automatisation des documents Word. Elle prend en charge la génération, l’édition, la conversion et l’extraction de documents. La bibliothèque vous permet d’extraire des pages spécifiques de fichiers Word avec une grande précision.

Pour commencer avec Aspose.Words for Python, vous devez installer le SDK. Veuillez le télécharger depuis les releases ou simplement l’installer en utilisant la commande pip suivante :

pip install aspose-words

Extraire une page d’un document Word en Python

Vous pouvez extraire une page spécifique d’un document Word en suivant les étapes ci-dessous :

  1. Chargez le document Word en utilisant la classe Document.
  2. Obtenez le nombre total de pages en utilisant le pagecount.
  3. Parcourez chaque page du document.
  4. Extraire une page à la fois en utilisant la méthode extractpages().
  5. Enregistrez chaque page extraites en tant que fichier .docx séparé.

Voici un extrait de code exemple démontrant l’extraction de page d’un document Word.

import aspose.words as aw

# load Word document
doc = aw.Document("sample-multi-page.docx")

# get page count
pageCount = doc.page_count

# parcourir les pages
for page in range(0, pageCount):
    # enregistrer chaque page en tant que document séparé
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"split_by_page_{page + 1}.docx")
Extraire une page d'un document Word en Python

Extraire une page d’un document Word en Python

Extraire une plage de pages d’un fichier Word en Python

Vous pouvez également extraire une plage de pages d’un fichier Word en suivant les étapes ci-dessous :

  1. Chargez le document Word en utilisant la classe Document.
  2. Extraire une plage de pages en utilisant la méthode extractpages().
  3. Enregistrez les pages extraites en tant que nouveau fichier .docx.

Voici comment cela fonctionne :

import aspose.words as aw

# load Word document
doc = aw.Document("sample-multi-page.docx")

# extraire une plage de pages
extractedPages = doc.extract_pages(3, 2)

# sauvegarder les pages en tant que document séparé
extractedPages.save("split_by_page_range.docx")
Extraire une plage de pages d'un fichier Word en Python

Extraire une plage de pages d’un fichier Word en Python

Obtenez une licence gratuite

Pour évaluer toutes les fonctionnalités d’Aspose.Words sans limitations, obtenez une licence temporaire gratuite.C’est rapide et facile.

Diviser un document Word en ligne

Essayez notre outil gratuit de séparation de documents Word en ligne.Téléchargez votre fichier, choisissez comment vous souhaitez le diviser et téléchargez instantanément le résultat.

Image

Extraire des pages d’un document Word : ressources gratuites

Explore more with these helpful links:

Conclusion

Dans cet article de blog, vous avez appris comment extraire des pages de documents Word en utilisant Aspose.Words for Python. Nous avons couvert des méthodes pour extraire une seule page, une plage spécifique de pages, et diviser l’ensemble du document en fichiers séparés. Cela aide à automatiser vos tâches de traitement de documents en utilisant Python.

Si vous avez des questions ou avez besoin d’aide, visitez notre support forum.

Voir aussi