ในบทความนี้ คุณจะได้เรียนรู้วิธีสร้างเครื่องมือตรวจสอบความแตกต่างของ PDF และเปรียบเทียบไฟล์ PDF สองไฟล์ใน Python

เปรียบเทียบไฟล์ PDF ใน Python

บ่อยครั้งที่คุณต้องเปรียบเทียบเอกสาร PDF สองเวอร์ชันและตรวจสอบความแตกต่างของเนื้อหา สิ่งนี้อาจจำเป็นเพื่อระบุการแก้ไขโดยตั้งใจหรือไม่ตั้งใจในเอกสาร เนื่องจากเป็นไปไม่ได้ที่จะตรวจสอบไฟล์ PDF แบบคำต่อคำ จึงมี เครื่องมือเปรียบเทียบ PDF ออนไลน์ มากมายที่ช่วยให้คุณค้นหาความแตกต่างระหว่างไฟล์ PDF สองไฟล์ อย่างไรก็ตาม หากคุณต้องการเปรียบเทียบไฟล์ PDF โดยทางโปรแกรมจากภายในแอปพลิเคชัน Python บทความนี้ช่วยคุณได้ภายในไม่กี่ขั้นตอนง่ายๆ

Python Library เพื่อเปรียบเทียบไฟล์ PDF - ดาวน์โหลดฟรี

Aspose.Words for Python เป็นไลบรารีที่มีประสิทธิภาพแต่ใช้งานง่ายสำหรับสร้างและประมวลผลเอกสารข้อความ เช่น DOC, DOCX และ PDF ไลบรารีช่วยให้คุณสามารถเปรียบเทียบเอกสารและติดตามการเปลี่ยนแปลงได้แม้ในระดับตัวอักษร เราจะใช้ไลบรารีนี้เพื่อเปรียบเทียบไฟล์ PDF ในบทความนี้ หากต้องการติดตั้งไลบรารีจาก PyPI คุณสามารถใช้คำสั่ง pip ต่อไปนี้

> pip install aspose-words

ขั้นตอนในการเปรียบเทียบไฟล์ PDF ใน Python

Aspose.Words for Python มีกลไกการเปรียบเทียบ PDF ที่ทรงพลังและช่วยให้คุณค้นหาความแตกต่างได้อย่างง่ายดาย ต่อไปนี้เป็นขั้นตอนในการเปรียบเทียบไฟล์ PDF สองไฟล์โดยใช้ไลบรารี Python ดังกล่าว

  • โหลดไฟล์ PDF ทั้งสองไฟล์
  • แปลงไฟล์ PDF เป็นรูปแบบ Word
  • เปรียบเทียบเอกสาร Word ทั้งสองฉบับเพื่อรับการเปลี่ยนแปลง
  • บันทึกเอกสารที่มีการเปลี่ยนแปลงเป็น PDF ไปยังตำแหน่งที่ต้องการ

ในส่วนต่อไปนี้ คุณจะเห็นวิธีการแปลงขั้นตอนที่กล่าวถึงข้างต้นเป็นโค้ด Python และเปรียบเทียบไฟล์ PDF สองไฟล์

เปรียบเทียบไฟล์ PDF สองไฟล์ใน Python

ต่อไปนี้เป็นขั้นตอนในการเปรียบเทียบไฟล์ PDF สองไฟล์และตรวจสอบความแตกต่างใน Python

  • ก่อนอื่น ให้โหลดไฟล์ PDF ทั้งสองไฟล์โดยใช้คลาส Document
  • จากนั้นแปลงไฟล์ PDF เป็นรูปแบบ Word DOCX โดยใช้วิธี Document.save()
  • สร้างและตั้งค่าการเปรียบเทียบตัวเลือกที่ต้องการและเปรียบเทียบเอกสารโดยใช้เมธอด Document.compare()
  • สุดท้าย บันทึกไฟล์ PDF ที่มีความแตกต่างโดยใช้เมธอด Document.save()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการเปรียบเทียบ PDF ใน Python

import aspose.words as aw
from datetime import date

# โหลดไฟล์ PDF
PDF1 = aw.Document("first.pdf")
PDF2 = aw.Document("second.pdf")

# แปลงไฟล์ PDF เป็นรูปแบบ Word
PDF1.save("first.docx", aw.SaveFormat.DOCX)
PDF2.save("second.docx", aw.SaveFormat.DOCX)

# โหลดเอกสาร Word ที่แปลงแล้ว 
DOC1 = aw.Document("first.docx")
DOC2 = aw.Document("second.docx")

# ตั้งค่าตัวเลือกการเปรียบเทียบ
options = aw.comparing.CompareOptions()            
options.ignore_formatting = True
options.ignore_headers_and_footers = True
options.ignore_case_changes = True
options.ignore_tables = True
options.ignore_fields = True
options.ignore_comments = True
options.ignore_textboxes = True
options.ignore_footnotes = True

# DOC1 จะมีการเปลี่ยนแปลงเป็นการแก้ไขหลังจากการเปรียบเทียบ
DOC1.compare(DOC2, "user", date.today(), options)

if (DOC1.revisions.count > 0):
    # บันทึกไฟล์ผลลัพธ์เป็น PDF
    DOC1.save("compared.pdf", aw.SaveFormat.PDF)
else:
    print("Documents are equal")

ภาพหน้าจอต่อไปนี้แสดงการเปรียบเทียบไฟล์ PDF สองไฟล์

การเปรียบเทียบไฟล์ PDF ใน Python

Python PDF Comparison Library - รับใบอนุญาตฟรี

คุณสามารถ รับใบอนุญาตชั่วคราวได้ฟรี เพื่อเปรียบเทียบไฟล์ PDF โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีเปรียบเทียบไฟล์ PDF สองไฟล์ใน Python นอกจากนี้ คุณได้เห็นวิธีการเปิดหรือปิดตัวเลือกการเปรียบเทียบต่างๆ สำหรับไฟล์ PDF แบบไดนามิก ดังนั้น คุณสามารถสร้างแอปพลิเคชันตัวตรวจสอบความแตกต่างของ PDF ใน Python ได้อย่างง่ายดาย

สำรวจไลบรารีเปรียบเทียบ PDF ของ Aspose สำหรับ Python

คุณสามารถสำรวจ เอกสารประกอบ ของไลบรารีที่เราใช้ในบทความนี้เพื่อสำรวจคุณลักษณะที่มีประโยชน์อื่นๆ ในกรณีที่มีคำถาม คุณสามารถถามเราได้ที่ ฟอรัม

ดูสิ่งนี้ด้วย