I den här artikeln kommer du att lära dig hur du skapar ditt PDF-differenskontrollverktyg och jämför två PDF-filer i Python.
Mycket ofta måste du jämföra två versioner av ett PDF-dokument och kontrollera skillnaden i innehållet. Detta kan krävas för att identifiera de avsiktliga eller oavsiktliga ändringarna i ett dokument. Eftersom det inte är möjligt att kontrollera PDF-filerna ord för ord, finns olika online PDF-jämförelseverktyg tillgängliga som låter dig hitta skillnaden mellan två PDF-filer. Men om du vill jämföra PDF-filer programmatiskt från din Python-applikation, hjälper den här artikeln dig att göra det inom några enkla steg.
- Python-bibliotek för att jämföra PDF-filer
- Steg för att jämföra två PDF-filer
- Jämför två PDF-filer i Python
Python-bibliotek för att jämföra PDF-filer – gratis nedladdning
Aspose.Words for Python är ett kraftfullt men ändå lättanvänt bibliotek för att skapa och bearbeta textdokument inklusive DOC, DOCX och PDF. Biblioteket låter dig jämföra dokumenten och spåra ändringarna även på teckennivå. Vi kommer att använda det här biblioteket för att jämföra PDF-filer i den här artikeln. För att installera biblioteket från PyPI, kan du använda följande pip-kommando.
> pip install aspose-words
Steg för att jämföra PDF-filer i Python
Aspose.Words för Python tillhandahåller en kraftfull PDF-jämförelsemekanism och låter dig hitta skillnaderna med lätthet. Följande är stegen för att jämföra två PDF-filer med hjälp av nämnda Python-bibliotek.
- Ladda båda PDF-filerna.
- Konvertera PDF-filerna till Word-format.
- Jämför båda Word-dokumenten för att få ändringar.
- Spara dokumentet som innehåller ändringarna som en PDF på önskad plats.
I följande avsnitt kommer du att se hur du omvandlar de ovan nämnda stegen till Python-kod och jämför två PDF-filer.
Jämför två PDF-filer i Python
Följande är stegen för att jämföra två PDF-filer och kontrollera skillnaderna i Python.
- Först laddar du båda PDF-filerna med Document class.
- Konvertera sedan PDF-filer till Word DOCX-format med metoden Document.save().
- Skapa och ställ in önskade CompareOptions och jämför dokument med metoden Document.compare().
- Slutligen, spara PDF-filen som innehåller skillnader med metoden Document.save().
Följande kodexempel visar hur man utför PDF-jämförelse i Python.
import aspose.words as aw
from datetime import date
# Ladda PDF-filer
PDF1 = aw.Document("first.pdf")
PDF2 = aw.Document("second.pdf")
# Konvertera PDF-filer till Word-format
PDF1.save("first.docx", aw.SaveFormat.DOCX)
PDF2.save("second.docx", aw.SaveFormat.DOCX)
# Ladda konverterade Word-dokument
DOC1 = aw.Document("first.docx")
DOC2 = aw.Document("second.docx")
# Ställ in jämförelsealternativ
options = aw.comparing.CompareOptions()
options.ignore_formatting = True
options.ignore_headers_and_footers = True
options.ignore_case_changes = True
options.ignore_tables = True
options.ignore_fields = True
options.ignore_comments = True
options.ignore_textboxes = True
options.ignore_footnotes = True
# DOC1 kommer att innehålla ändringar som revisioner efter jämförelse
DOC1.compare(DOC2, "user", date.today(), options)
if (DOC1.revisions.count > 0):
# Spara den resulterande filen som PDF
DOC1.save("compared.pdf", aw.SaveFormat.PDF)
else:
print("Documents are equal")
Följande skärmdump visar jämförelsen av två PDF-filer.
Python PDF Comparison Library - Skaffa en gratis licens
Du kan skaffa en gratis tillfällig licens för att jämföra PDF-filer utan utvärderingsbegränsningar.
Slutsats
I den här artikeln har du lärt dig hur du jämför två PDF-filer i Python. Dessutom har du sett hur du aktiverar eller inaktiverar olika jämförelsealternativ för PDF-filer dynamiskt. Således kan du skapa din PDF-skillnadskontrollapplikation i Python ganska enkelt.
Utforska Asposes PDF-jämförelsebibliotek för Python
Du kan utforska dokumentationen för biblioteket som vi har använt i den här artikeln för att utforska andra användbara funktioner. Om du har några frågor kan du fråga oss via vårt forum.