Porovnejte dokumenty Word pomocí Python

Porovnání dokumentů aplikace Word se provádí v různých případech, aby se zjistily rozdíly. Různé online nástroje vám umožňují porovnávat dokumenty aplikace Word, ale možná budete muset implementovat funkci porovnání z vašich aplikací. Abychom toho dosáhli, tento článek ukazuje, jak porovnat dva dokumenty Wordu v Python.

Knihovna Python pro porovnání dokumentů aplikace Word

Pro porovnání dokumentů DOCX nebo DOC použijeme Aspose.Words for Python. Uvedená knihovna vám umožňuje automatizovat funkce zpracování textu z vašich aplikací Python. Knihovnu můžete nainstalovat z PyPI pomocí následujícího příkazu pip.

pip install aspose-words

Porovnejte dva dokumenty Word v Python

Aspose.Words for Python vám docela usnadňuje porovnání dvou dokumentů aplikace Word. V procesu porovnání jsou změny zaúčtovány v prvním dokumentu jako revize. Následují kroky k porovnání dvou dokumentů Wordu v Python.

  • Nejprve načtěte první dokument aplikace Word pomocí třídy Document.
  • Poté načtěte druhý dokument pomocí třídy Document.
  • Zavolejte metodu Compare(Document, string, datetime.today()) pomocí objektu Document prvního dokumentu.
  • Zkontrolujte, zda se dokumenty liší pomocí vlastnosti Document.revisions.count.
  • Nakonec uložte první dokument, abyste získali revize.

Následující ukázka kódu ukazuje, jak porovnat dva dokumenty aplikace Word.

import aspose.words as aw
from datetime import date

# načíst první dokument
doc = aw.Document("calibre.docx")

# načíst druhý dokument
doc2 = aw.Document("calibre2.docx")

# porovnat dokumenty
doc.compare(doc2, "user", date.today())

# uložte dokument, abyste získali revize
if (doc.revisions.count > 0):
    doc.save("compared.docx")
else:
    print("Documents are equal")

Následuje snímek obrazovky s výsledkem srovnání.

Porovnejte dva dokumenty Word pomocí Python

Další možnosti pro porovnávání dokumentů aplikace Word

Aspose.Words také poskytuje některé další možnosti pro řízení procesu porovnávání dokumentů. Můžete například ignorovat určité typy prvků, jako jsou záhlaví, zápatí, komentáře atd. Můžete také nastavit granularitu a určit, zda se mají dokumenty porovnávat podle znaků nebo slov. Následují kroky pro nastavení těchto možností.

  • Nejprve načtěte první dokument aplikace Word pomocí třídy Document.
  • Poté načtěte druhý dokument pomocí třídy Document.
  • Vytvořte instanci třídy CompareOptions a nastavte požadované možnosti.
  • Zavolejte metodu Compare(Document, string, datetime.today(), CompareOptions) pomocí objektu Document prvního dokumentu.
  • Zkontrolujte, zda se dokumenty liší pomocí vlastnosti Document.revisions.count.
  • Nakonec uložte první dokument, abyste získali revize.

Následující ukázka kódu ukazuje, jak používat další možnosti při porovnávání dvou dokumentů aplikace Word.

import aspose.words as aw
from datetime import date

# načíst první dokument
doc = aw.Document("calibre.docx")

# načíst druhý dokument
doc2 = aw.Document("calibre2.docx")

# nastavit další možnosti
options = aw.comparing.CompareOptions()            
options.ignore_formatting = True
options.ignore_headers_and_footers = True
options.ignore_case_changes = True
options.ignore_tables = True
options.ignore_fields = True
options.ignore_comments = True
options.ignore_textboxes = True
options.ignore_footnotes = True

# porovnat dokumenty
doc.compare(doc2, "user", date.today(), options)

# uložte dokument, abyste získali revize
if (doc.revisions.count > 0):
    doc.save("compared.docx")
else:
    print("Documents are equal")

Získejte bezplatnou licenci API

Můžete získat dočasnou licenci, abyste mohli používat Aspose.Words for Python bez omezení hodnocení.

Závěr

V tomto článku jste se naučili porovnat dva dokumenty Wordu v Python. Navíc jste viděli, jak ovládat operaci porovnávání dokumentů pomocí různých možností. Kromě toho můžete prozkoumat další funkce Aspose.Words for Python pomocí dokumentace. V případě jakýchkoliv dotazů se nás můžete zeptat na našem fóru.

Viz také