Vergleichen Sie Word-, PDF und PPT Dokumente in Python

Der Dokumentenvergleich ist in verschiedenen Branchen eine wesentliche Aufgabe, von der juristischen Prüfung bis zur technischen Redaktion. Die Sicherstellung der Genauigkeit und die Identifizierung von Änderungen in verschiedenen Dokumentversionen kann zeitaufwändig sein. Ob es darum geht, verschiedene Versionen eines Word Dokuments zu vergleichen, die Änderungen in einer PDF-Datei zu analysieren oder Unstimmigkeiten in einer PowerPoint-Präsentation zu identifizieren, der Dokumentenvergleich ist ein entscheidender Aspekt des Entwicklungsprozesses. In diesem Blogartikel untersuchen wir, wie man Word (DOC oder DOCX), PDF und PowerPoint (PPT oder PPTX vergleicht) Dokumente in Python.

Python Dokumentvergleichs-APIs

Aspose ist auf die Erstellung von Dokumentverarbeitungs-APIs spezialisiert, mit denen Entwickler mit verschiedenen Dateiformaten arbeiten können, ohne auf externe Software wie Microsoft Office angewiesen zu sein. Mithilfe der APIs können Entwickler eine Vielzahl von Dateitypen erstellen, bearbeiten, konvertieren und rendern. Dazu gehören gängige Dokumentformate wie Word, Excel, PowerPoint und PDF, aber auch Bilder, Archive (ZIP) und sogar einige CAD-Formate. Eine der wichtigsten Funktionen dieser APIs ist der Dokumentenvergleich, der dabei hilft, Unterschiede zwischen zwei Dokumenten schnell zu erkennen.

Lassen Sie uns untersuchen, wie Sie Word-, PDF und PowerPoint Dokumente in einer Python-Anwendung vergleichen.

Vergleichen Sie PDF Dokumente in Python

Python-PDF-Vergleichs-API

Der Vergleich von PDF Dokumenten kann aufgrund der Komplexität des Dateiformats eine Herausforderung darstellen. Aspose.Words for Python ist jedoch eine robuste Dokumentverarbeitungs-API, die es Entwicklern ermöglicht, PDF Dokumente effektiv zu vergleichen. Es vereinfacht die Art und Weise, wie Sie programmgesteuert mit Dokumenten arbeiten. Gehen wir also die Schritte zum Vergleichen zweier PDF Dateien in Python durch.

  1. Installieren Sie Aspose.Words for Python über .NET.
  2. Laden Sie beide PDF Dateien mit der Document Klasse.
  3. Konvertieren Sie PDF Dateien in das bearbeitbare Word-Format.
  4. Geben Sie optional die gewünschten Vergleichsoptionen mithilfe der CompareOptions Klasse an.
  5. Laden Sie die konvertierten Dateien und vergleichen Sie sie mit der Methode Document.compare().
  6. Speichern Sie abschließend das PDF mit den Vergleichsergebnissen mit der Methode Document.save().

Das folgende Codebeispiel zeigt, wie PDF Dokumente in Python verglichen werden.

# Dieses Codebeispiel zeigt, wie zwei PDF Dateien in Python verglichen werden
import aspose.words as aw
from datetime import date

# Laden Sie PDF Dateien
PDF1 = aw.Document("Document.pdf")
PDF2 = aw.Document("Document2.pdf")

# Konvertieren Sie PDF Dateien in das Word-Format
PDF1.save("first.docx", aw.SaveFormat.DOCX)
PDF2.save("second.docx", aw.SaveFormat.DOCX)

# Laden Sie konvertierte Word Dokumente 
DOC1 = aw.Document("first.docx")
DOC2 = aw.Document("second.docx")

# Vergleichsoptionen festlegen
options = aw.comparing.CompareOptions()            
options.ignore_formatting = True
options.ignore_headers_and_footers = True
options.ignore_case_changes = True
options.ignore_tables = True
options.ignore_fields = True
options.ignore_comments = True
options.ignore_textboxes = True
options.ignore_footnotes = True

# DOC1 enthält nach dem Vergleich Änderungen als Revisionen
DOC1.compare(DOC2, "user", date.today(), options)

if (DOC1.revisions.count > 0):
    # Speichern Sie die resultierende Datei als PDF
    DOC1.save("compared.pdf", aw.SaveFormat.PDF)
else:
    print("Documents are equal")

Beginnen Sie mit der Python Dokumentverarbeitungs-API mithilfe der unten angegebenen Ressourcen:

Vergleichen Sie Word Dokumente in Python

Python-Word-Vergleichs-API

Zum Vergleichen von Word Dokumenten verwenden wir dieselbe Dokumentverarbeitungs-API, die wir oben verwendet haben: Aspose.Words for Python. Schauen wir uns die Schritte zum Vergleichen zweier Word Dokumente in Python an.

  1. Installieren Sie Aspose.Words for Python über .NET.
  2. Laden Sie beide Word Dokumente mit der Document Klasse.
  3. Rufen Sie die Methode Document.compare() auf, um die Dokumente zu vergleichen.
  4. Speichern Sie abschließend das Dokument mit den Vergleichsergebnissen mit der Methode Document.save().

Das folgende Codebeispiel zeigt, wie zwei Word Dokumente in Python verglichen werden.

# Dieses Codebeispiel zeigt, wie zwei Word Dateien in Python verglichen werden
import aspose.words as aw
from datetime import date

# Laden Sie das erste Dokument
doc = aw.Document("Document.docx")

# Zweites Dokument laden
doc2 = aw.Document("Document2.docx")

# Dokumente vergleichen
doc.compare(doc2, "user", date.today())

# Speichern Sie das Dokument, um die Überarbeitungen zu erhalten
if (doc.revisions.count > 0):
    doc.save("Compared_Document.docx")
else:
    print("Documents are equal")

Vergleichen Sie PPT-Folien in Python

Python PowerPoint-Vergleichs-API

Wir werden die API Aspose.Slides for Python zum Vergleichen von PowerPoint-Präsentationsfolien verwenden. Es handelt sich um eine leistungsstarke Bibliothek, die Ihnen die Arbeit mit Präsentationen in Python ermöglicht. Im Folgenden finden Sie die Schritte zum Vergleichen von Folien in zwei PowerPoint-Präsentationen.

  1. Installieren Sie Aspose.Slides for Python über .NET.
  2. Laden Sie Quell und Ziel-PPT Dateien mit der Presentation Klasse.
  3. Durchlaufen Sie die Folien der Quell-PPT-Datei.
  4. Erstellen Sie dann eine verschachtelte Schleife für Folien in der Ziel-PPT-Datei.
  5. Überprüfen Sie, ob die Folien gleich sind.

Das folgende Codebeispiel zeigt, wie Folien aus zwei PowerPoint-PPT Dateien in Python verglichen werden.

# Dieses Codebeispiel zeigt, wie zwei PowerPoint-Präsentationsfolien in Python verglichen werden
import aspose.slides as slides

with slides.Presentation("AccessSlides.pptx") as p1:
    with slides.Presentation("HelloWorld.pptx") as p2:
       for i in range(len(p1.masters)):
           for j in range(len(p2.masters)):
                if p1.masters[i] == p2.masters[j]:
                    print("Presentation1 MasterSlide#{0} is equal to Presentation2 MasterSlide#{1}".format(i,j))
                else:
                    print("Presentation1 MasterSlide#{0} is not equal to Presentation2 MasterSlide#{1}".format(i,j))

Erfahren Sie mehr über die Python PowerPoint-Verarbeitungs-API und erkunden Sie verschiedene andere Funktionen der API mithilfe der folgenden Ressourcen:

Zusammenfassen

Zusammenfassend bietet Aspose eine Reihe leistungsstarker Dokumentverarbeitungs-APIs, mit denen Word-, PDF und PPT Dokumente effizient verglichen werden können. Durch die Nutzung der Funktionen dieser Bibliotheken können Softwareentwickler den Dokumentvergleichsprozess rationalisieren und die Genauigkeit und Konsistenz ihrer Arbeit sicherstellen. In diesem Artikel haben wir Sie durch den gesamten Prozess des Vergleichs von Dokumenten in den Formaten Word, PDF und PPT mit Python geführt. Sie können den bereitgestellten Richtlinien problemlos folgen und den Dokumentvergleich in Ihre Python-Anwendungen integrieren. Bei Unklarheiten können Sie uns gerne über unser kostenloses Support-Forum kontaktieren.