Comparez les documents Word, PDF et PPT en Python

La comparaison de documents est une tâche essentielle dans divers secteurs, des révisions juridiques à l’édition technique. Garantir l’exactitude et identifier les modifications dans les différentes versions de documents peut s’avérer un véritable casse-tête. Qu’il s’agisse de comparer différentes versions d’un document Word, d’analyser les modifications apportées à un fichier PDF ou d’identifier des divergences dans une présentation PowerPoint, la comparaison de documents est un aspect crucial du processus de développement. Dans cet article de blog, nous explorerons comment comparer Word (DOC ou DOCX), PDF et PowerPoint (PPT ou PPTX) documents en Python.

API de comparaison de documents Python

Aspose se spécialise dans la création d’API de traitement de documents permettant aux développeurs de travailler avec différents formats de fichiers sans recourir à des logiciels externes comme Microsoft Office. Les API permettent aux développeurs de créer, modifier, convertir et restituer un large éventail de types de fichiers. Cela inclut les formats de documents courants tels que Word, Excel, PowerPoint et PDF, mais s’étend également aux images, aux archives (ZIP) et même à certains formats CAO. L’une des fonctionnalités clés fournies par ces API est la comparaison de documents, qui permet d’identifier rapidement les différences entre deux documents.

Voyons comment comparer des documents Word, PDF et PowerPoint dans une application Python.

Comparez des documents PDF en Python

API de comparaison de PDF Python

La comparaison de documents PDF peut s’avérer difficile en raison de la complexité du format de fichier. Cependant, Aspose.Words for Python est une API de traitement de documents robuste qui permet aux développeurs de comparer efficacement les documents PDF. Cela simplifie la façon dont vous travaillez avec des documents par programmation. Passons donc aux étapes de comparaison de deux fichiers PDF en Python.

  1. Installez Aspose.Words for Python via .NET.
  2. Chargez les deux fichiers PDF à l’aide de la classe Document.
  3. Convertissez les fichiers PDF au format Word modifiable.
  4. Vous pouvez éventuellement spécifier les options de comparaison souhaitées à l’aide de la classe CompareOptions.
  5. Chargez les fichiers convertis et comparez-les à l’aide de la méthode Document.compare().
  6. Enfin, enregistrez le PDF contenant les résultats de la comparaison à l’aide de la méthode Document.save().

L’exemple de code suivant montre comment comparer des documents PDF en Python.

# Cet exemple de code montre comment comparer deux fichiers PDF en Python
import aspose.words as aw
from datetime import date

# Charger des fichiers PDF
PDF1 = aw.Document("Document.pdf")
PDF2 = aw.Document("Document2.pdf")

# Convertir des fichiers PDF au format Word
PDF1.save("first.docx", aw.SaveFormat.DOCX)
PDF2.save("second.docx", aw.SaveFormat.DOCX)

# Charger des documents Word convertis 
DOC1 = aw.Document("first.docx")
DOC2 = aw.Document("second.docx")

# Définir les options de comparaison
options = aw.comparing.CompareOptions()            
options.ignore_formatting = True
options.ignore_headers_and_footers = True
options.ignore_case_changes = True
options.ignore_tables = True
options.ignore_fields = True
options.ignore_comments = True
options.ignore_textboxes = True
options.ignore_footnotes = True

# DOC1 contiendra des modifications sous forme de révisions après comparaison
DOC1.compare(DOC2, "user", date.today(), options)

if (DOC1.revisions.count > 0):
    # Enregistrer le fichier résultant au format PDF
    DOC1.save("compared.pdf", aw.SaveFormat.PDF)
else:
    print("Documents are equal")

Démarrez avec l’API de traitement de documents Python à l’aide des ressources indiquées ci-dessous :

Comparez des documents Word en Python

API de comparaison de mots Python

Pour comparer les documents Word, nous utiliserons la même API de traitement de documents que celle utilisée ci-dessus : Aspose.Words for Python. Jetons un coup d’œil aux étapes pour comparer deux documents Word en Python.

  1. Installez Aspose.Words for Python via .NET.
  2. Chargez les deux documents Word à l’aide de la classe Document.
  3. Appelez la méthode Document.compare() pour comparer les documents.
  4. Enfin, enregistrez le document contenant les résultats de la comparaison à l’aide de la méthode Document.save().

L’exemple de code suivant montre comment comparer deux documents Word en Python.

# Cet exemple de code montre comment comparer deux fichiers Word en Python
import aspose.words as aw
from datetime import date

# charger le premier document
doc = aw.Document("Document.docx")

# charger le deuxième document
doc2 = aw.Document("Document2.docx")

# comparer des documents
doc.compare(doc2, "user", date.today())

# enregistrez le document pour obtenir les révisions
if (doc.revisions.count > 0):
    doc.save("Compared_Document.docx")
else:
    print("Documents are equal")

Comparez les diapositives PPT en Python

API de comparaison Python PowerPoint

Nous utiliserons l’API Aspose.Slides for Python pour comparer les diapositives de présentation PowerPoint. Il s’agit d’une bibliothèque puissante qui vous permet de travailler avec des présentations en Python. Voici les étapes pour comparer les diapositives de deux présentations PowerPoint.

  1. Installez Aspose.Slides for Python via .NET.
  2. Chargez les fichiers PPT source et cible à l’aide de la classe Présentation.
  3. Parcourez les diapositives du fichier PPT source.
  4. Ensuite, créez une boucle imbriquée pour les diapositives dans le fichier PPT cible.
  5. Vérifiez si les diapositives sont égales.

L’exemple de code suivant montre comment comparer les diapositives de deux fichiers PowerPoint PPT en Python.

# Cet exemple de code montre comment comparer deux diapositives de présentation PowerPoint en Python
import aspose.slides as slides

with slides.Presentation("AccessSlides.pptx") as p1:
    with slides.Presentation("HelloWorld.pptx") as p2:
       for i in range(len(p1.masters)):
           for j in range(len(p2.masters)):
                if p1.masters[i] == p2.masters[j]:
                    print("Presentation1 MasterSlide#{0} is equal to Presentation2 MasterSlide#{1}".format(i,j))
                else:
                    print("Presentation1 MasterSlide#{0} is not equal to Presentation2 MasterSlide#{1}".format(i,j))

Apprenez-en davantage sur l’API de traitement Python PowerPoint et explorez diverses autres fonctionnalités de l’API à l’aide des ressources ci-dessous :

Résumé

En conclusion, Aspose propose une gamme d’API puissantes de traitement de documents qui peuvent être utilisées pour comparer efficacement des documents Word, PDF et PPT. En tirant parti des capacités de ces bibliothèques, les développeurs de logiciels peuvent rationaliser le processus de comparaison de documents et garantir l’exactitude et la cohérence de leur travail. Dans cet article, nous vous avons guidé tout au long du processus complet de comparaison de documents aux formats Word, PDF et PPT à l’aide de Python. Vous pouvez facilement suivre les directives fournies et intégrer la comparaison de documents dans vos applications Python. En cas d’ambiguïté, n’hésitez pas à nous contacter sur notre forum d’assistance gratuit.