במאמר זה תלמד כיצד ליצור את כלי בודק הבדלים ב-PDF שלך ולהשוות בין שני קבצי PDF ב-Python.

השווה קבצי PDF ב-Python

לעתים קרובות מאוד, אתה צריך להשוות שתי גרסאות של מסמך PDF ולבדוק את ההבדל בתוכן. זה עשוי להידרש כדי לזהות את השינויים המכוונים או הלא מכוונים במסמך. מכיוון שלא ניתן לבדוק את קבצי ה-PDF מילה אחר מילה, זמינים כלים מקוונים להשוואת PDF המאפשרים לך למצוא את ההבדל בין שני קבצי PDF. עם זאת, אם ברצונך להשוות קבצי PDF באופן פרוגרמטי מתוך אפליקציית Python שלך, מאמר זה יעזור לך לעשות זאת תוך כמה שלבים פשוטים.

ספריית Python להשוואת קובצי PDF - הורדה חינם

Aspose.Words for Python היא ספרייה רבת עוצמה אך קלה לשימוש ליצירה ועיבוד של מסמכי טקסט כולל DOC, DOCX ו-PDF. הספרייה מאפשרת לך להשוות בין המסמכים ולעקוב אחר השינויים גם ברמת התווים. אנו הולכים להשתמש בספרייה זו כדי להשוות קבצי PDF במאמר זה. כדי להתקין את הספרייה מ-PyPI, אתה יכול להשתמש בפקודה pip הבאה.

> pip install aspose-words

שלבים להשוואת קובצי PDF ב- Python

Aspose.Words עבור Python מספק מנגנון השוואת PDF רב עוצמה ומאפשר לך למצוא את ההבדלים בקלות. להלן השלבים להשוואת שני קבצי PDF באמצעות ספריית Python האמורה.

  • טען את שני קבצי ה-PDF.
  • המר את קבצי ה-PDF לפורמט וורד.
  • השווה את שני מסמכי Word כדי לקבל שינויים.
  • שמור את המסמך המכיל את השינויים כקובץ PDF במיקום הרצוי.

בסעיף הבא, תראה כיצד להפוך את השלבים שהוזכרו לעיל לקוד Python ולהשוות שני קבצי PDF.

השווה שני קבצי PDF ב-Python

להלן השלבים להשוואת שני קובצי PDF ולבדוק את ההבדלים ב- Python.

  • ראשית, טען את שני קבצי ה-PDF באמצעות Document class.
  • לאחר מכן, המר קבצי PDF לפורמט Word DOCX באמצעות שיטת Document.save() .
  • צור והגדר את CompareOptions הרצויות והשווה מסמכים באמצעות שיטת Document.compare() .
  • לבסוף, שמור את קובץ ה-PDF המכיל הבדלים באמצעות שיטת Document.save().

דוגמת הקוד הבאה מראה כיצד לבצע השוואת PDF ב-Python.

import aspose.words as aw
from datetime import date

# טען קבצי PDF
PDF1 = aw.Document("first.pdf")
PDF2 = aw.Document("second.pdf")

# המרת קבצי PDF לפורמט וורד
PDF1.save("first.docx", aw.SaveFormat.DOCX)
PDF2.save("second.docx", aw.SaveFormat.DOCX)

# טען מסמכי Word שהומרו 
DOC1 = aw.Document("first.docx")
DOC2 = aw.Document("second.docx")

# הגדר אפשרויות השוואה
options = aw.comparing.CompareOptions()            
options.ignore_formatting = True
options.ignore_headers_and_footers = True
options.ignore_case_changes = True
options.ignore_tables = True
options.ignore_fields = True
options.ignore_comments = True
options.ignore_textboxes = True
options.ignore_footnotes = True

# DOC1 יכיל שינויים כתיקונים לאחר השוואה
DOC1.compare(DOC2, "user", date.today(), options)

if (DOC1.revisions.count > 0):
    # שמור את הקובץ שנוצר כ-PDF
    DOC1.save("compared.pdf", aw.SaveFormat.PDF)
else:
    print("Documents are equal")

צילום המסך הבא מציג את ההשוואה בין שני קבצי PDF.

השוואה של קבצי PDF ב-Python

ספריית השוואת PDF של Python - קבל רישיון חינם

אתה יכול לקבל רישיון זמני בחינם להשוואת קובצי PDF ללא מגבלות הערכה.

סיכום

במאמר זה, למדת כיצד להשוות בין שני קבצי PDF ב-Python. יתר על כן, ראית כיצד להפעיל או להשבית אפשרויות השוואה שונות עבור קבצי PDF באופן דינמי. לפיכך, אתה יכול ליצור את אפליקציית בודק הבדל PDF שלך ב- Python די בקלות.

חקור את ספריית השוואת PDF של Aspose עבור Python

אתה יכול לחקור את התיעוד של הספרייה שבה השתמשנו במאמר זה כדי לחקור תכונות שימושיות אחרות. בכל שאלה, אתה יכול לשאול אותנו דרך הפורום שלנו.

ראה גם