در این مقاله یاد خواهید گرفت که چگونه ابزار بررسی تفاوت PDF خود را ایجاد کنید و دو فایل PDF را در پایتون مقایسه کنید.

مقایسه فایل های PDF در پایتون

اغلب، شما باید دو نسخه از یک سند PDF را با هم مقایسه کنید و تفاوت محتوا را بررسی کنید. این ممکن است برای شناسایی تغییرات عمدی یا غیرعمدی در یک سند مورد نیاز باشد. از آنجایی که بررسی کلمه به کلمه فایل های PDF امکان پذیر نیست، ابزارهای مقایسه آنلاین PDF مختلفی در دسترس هستند که به شما امکان می دهند تفاوت بین دو فایل PDF را پیدا کنید. با این حال، اگر می‌خواهید فایل‌های PDF را به صورت برنامه‌نویسی از داخل برنامه پایتون خود مقایسه کنید، این مقاله به شما کمک می‌کند این کار را در چند مرحله آسان انجام دهید.

کتابخانه Python برای مقایسه فایل‌های PDF - دانلود رایگان

Aspose.Words for Python یک کتابخانه قدرتمند و در عین حال آسان برای ایجاد و پردازش اسناد متنی از جمله DOC، DOCX و PDF است. این کتابخانه به شما امکان می دهد اسناد را مقایسه کنید و تغییرات را حتی در سطح کاراکتر دنبال کنید. ما در این مقاله قصد داریم از این کتابخانه برای مقایسه فایل های PDF استفاده کنیم. برای نصب کتابخانه از PyPI، می توانید از دستور pip زیر استفاده کنید.

> pip install aspose-words

مراحل مقایسه فایل های PDF در پایتون

Aspose.Words برای پایتون یک مکانیسم قدرتمند مقایسه PDF را ارائه می دهد و به شما امکان می دهد تفاوت ها را به راحتی پیدا کنید. مراحل زیر برای مقایسه دو فایل PDF با استفاده از کتابخانه Python ذکر شده است.

  • هر دو فایل PDF را بارگیری کنید.
  • فایل های PDF را به فرمت Word تبدیل کنید.
  • برای دریافت تغییرات، هر دو سند Word را مقایسه کنید.
  • سند حاوی تغییرات را به صورت PDF در محل مورد نظر ذخیره کنید.

در بخش زیر نحوه تبدیل مراحل فوق به کد پایتون و مقایسه دو فایل PDF را مشاهده خواهید کرد.

مقایسه دو فایل PDF در پایتون

مراحل زیر برای مقایسه دو فایل PDF و بررسی تفاوت در پایتون است.

  • ابتدا هر دو فایل PDF را با استفاده از کلاس Document بارگیری کنید.
  • سپس فایل های PDF را با استفاده از روش ()Document.save به فرمت Word DOCX تبدیل کنید.
  • CompareOptions دلخواه را ایجاد و تنظیم کنید و اسناد را با استفاده از روش Document.compare() مقایسه کنید.
  • در نهایت، فایل PDF حاوی تفاوت ها را با استفاده از روش ()Document.save ذخیره کنید.

نمونه کد زیر نحوه انجام مقایسه PDF در پایتون را نشان می دهد.

import aspose.words as aw
from datetime import date

# فایل های PDF را بارگیری کنید
PDF1 = aw.Document("first.pdf")
PDF2 = aw.Document("second.pdf")

# تبدیل فایل های PDF به فرمت Word
PDF1.save("first.docx", aw.SaveFormat.DOCX)
PDF2.save("second.docx", aw.SaveFormat.DOCX)

# اسناد Word تبدیل شده را بارگیری کنید 
DOC1 = aw.Document("first.docx")
DOC2 = aw.Document("second.docx")

# گزینه های مقایسه را تنظیم کنید
options = aw.comparing.CompareOptions()            
options.ignore_formatting = True
options.ignore_headers_and_footers = True
options.ignore_case_changes = True
options.ignore_tables = True
options.ignore_fields = True
options.ignore_comments = True
options.ignore_textboxes = True
options.ignore_footnotes = True

# DOC1 شامل تغییراتی به عنوان تجدید نظر پس از مقایسه خواهد بود
DOC1.compare(DOC2, "user", date.today(), options)

if (DOC1.revisions.count > 0):
    # فایل حاصل را به صورت PDF ذخیره کنید
    DOC1.save("compared.pdf", aw.SaveFormat.PDF)
else:
    print("Documents are equal")

اسکرین شات زیر مقایسه دو فایل PDF را نشان می دهد.

مقایسه فایل های پی دی اف در پایتون

کتابخانه مقایسه Python PDF - یک مجوز رایگان دریافت کنید

برای مقایسه فایل‌های PDF بدون محدودیت ارزیابی، می‌توانید یک مجوز موقت رایگان دریافت کنید.

نتیجه

در این مقاله نحوه مقایسه دو فایل PDF در پایتون را یاد گرفتید. علاوه بر این، نحوه فعال یا غیرفعال کردن گزینه های مختلف مقایسه فایل های PDF را به صورت پویا مشاهده کرده اید. بنابراین، شما می توانید برنامه بررسی تفاوت PDF خود را به راحتی در پایتون ایجاد کنید.

کتابخانه مقایسه PDF Aspose برای پایتون را کاوش کنید

می‌توانید اسناد کتابخانه‌ای را که در این مقاله برای بررسی سایر ویژگی‌های مفید استفاده کرده‌ایم، کاوش کنید. در صورت داشتن هرگونه سوال، می توانید از طریق [تالار گفتمان5 ما از ما بپرسید.

همچنین ببینید