ในบทความนี้ คุณจะได้เรียนรู้วิธีสร้างเครื่องมือตรวจสอบความแตกต่างของ PDF และเปรียบเทียบไฟล์ PDF สองไฟล์ใน Python
บ่อยครั้งที่คุณต้องเปรียบเทียบเอกสาร PDF สองเวอร์ชันและตรวจสอบความแตกต่างของเนื้อหา สิ่งนี้อาจจำเป็นเพื่อระบุการแก้ไขโดยตั้งใจหรือไม่ตั้งใจในเอกสาร เนื่องจากเป็นไปไม่ได้ที่จะตรวจสอบไฟล์ PDF แบบคำต่อคำ จึงมี เครื่องมือเปรียบเทียบ PDF ออนไลน์ มากมายที่ช่วยให้คุณค้นหาความแตกต่างระหว่างไฟล์ PDF สองไฟล์ อย่างไรก็ตาม หากคุณต้องการเปรียบเทียบไฟล์ PDF โดยทางโปรแกรมจากภายในแอปพลิเคชัน Python บทความนี้ช่วยคุณได้ภายในไม่กี่ขั้นตอนง่ายๆ
- Python Library เพื่อเปรียบเทียบไฟล์ PDF
- ขั้นตอนในการเปรียบเทียบไฟล์ PDF สองไฟล์
- เปรียบเทียบไฟล์ PDF สองไฟล์ใน Python
Python Library เพื่อเปรียบเทียบไฟล์ PDF - ดาวน์โหลดฟรี
Aspose.Words for Python เป็นไลบรารีที่มีประสิทธิภาพแต่ใช้งานง่ายสำหรับสร้างและประมวลผลเอกสารข้อความ เช่น DOC, DOCX และ PDF ไลบรารีช่วยให้คุณสามารถเปรียบเทียบเอกสารและติดตามการเปลี่ยนแปลงได้แม้ในระดับตัวอักษร เราจะใช้ไลบรารีนี้เพื่อเปรียบเทียบไฟล์ PDF ในบทความนี้ หากต้องการติดตั้งไลบรารีจาก PyPI คุณสามารถใช้คำสั่ง pip ต่อไปนี้
> pip install aspose-words
ขั้นตอนในการเปรียบเทียบไฟล์ PDF ใน Python
Aspose.Words for Python มีกลไกการเปรียบเทียบ PDF ที่ทรงพลังและช่วยให้คุณค้นหาความแตกต่างได้อย่างง่ายดาย ต่อไปนี้เป็นขั้นตอนในการเปรียบเทียบไฟล์ PDF สองไฟล์โดยใช้ไลบรารี Python ดังกล่าว
- โหลดไฟล์ PDF ทั้งสองไฟล์
- แปลงไฟล์ PDF เป็นรูปแบบ Word
- เปรียบเทียบเอกสาร Word ทั้งสองฉบับเพื่อรับการเปลี่ยนแปลง
- บันทึกเอกสารที่มีการเปลี่ยนแปลงเป็น PDF ไปยังตำแหน่งที่ต้องการ
ในส่วนต่อไปนี้ คุณจะเห็นวิธีการแปลงขั้นตอนที่กล่าวถึงข้างต้นเป็นโค้ด Python และเปรียบเทียบไฟล์ PDF สองไฟล์
เปรียบเทียบไฟล์ PDF สองไฟล์ใน Python
ต่อไปนี้เป็นขั้นตอนในการเปรียบเทียบไฟล์ PDF สองไฟล์และตรวจสอบความแตกต่างใน Python
- ก่อนอื่น ให้โหลดไฟล์ PDF ทั้งสองไฟล์โดยใช้คลาส Document
- จากนั้นแปลงไฟล์ PDF เป็นรูปแบบ Word DOCX โดยใช้วิธี Document.save()
- สร้างและตั้งค่าการเปรียบเทียบตัวเลือกที่ต้องการและเปรียบเทียบเอกสารโดยใช้เมธอด Document.compare()
- สุดท้าย บันทึกไฟล์ PDF ที่มีความแตกต่างโดยใช้เมธอด Document.save()
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการเปรียบเทียบ PDF ใน Python
import aspose.words as aw
from datetime import date
# โหลดไฟล์ PDF
PDF1 = aw.Document("first.pdf")
PDF2 = aw.Document("second.pdf")
# แปลงไฟล์ PDF เป็นรูปแบบ Word
PDF1.save("first.docx", aw.SaveFormat.DOCX)
PDF2.save("second.docx", aw.SaveFormat.DOCX)
# โหลดเอกสาร Word ที่แปลงแล้ว
DOC1 = aw.Document("first.docx")
DOC2 = aw.Document("second.docx")
# ตั้งค่าตัวเลือกการเปรียบเทียบ
options = aw.comparing.CompareOptions()
options.ignore_formatting = True
options.ignore_headers_and_footers = True
options.ignore_case_changes = True
options.ignore_tables = True
options.ignore_fields = True
options.ignore_comments = True
options.ignore_textboxes = True
options.ignore_footnotes = True
# DOC1 จะมีการเปลี่ยนแปลงเป็นการแก้ไขหลังจากการเปรียบเทียบ
DOC1.compare(DOC2, "user", date.today(), options)
if (DOC1.revisions.count > 0):
# บันทึกไฟล์ผลลัพธ์เป็น PDF
DOC1.save("compared.pdf", aw.SaveFormat.PDF)
else:
print("Documents are equal")
ภาพหน้าจอต่อไปนี้แสดงการเปรียบเทียบไฟล์ PDF สองไฟล์
Python PDF Comparison Library - รับใบอนุญาตฟรี
คุณสามารถ รับใบอนุญาตชั่วคราวได้ฟรี เพื่อเปรียบเทียบไฟล์ PDF โดยไม่มีข้อจำกัดในการประเมิน
บทสรุป
ในบทความนี้ คุณได้เรียนรู้วิธีเปรียบเทียบไฟล์ PDF สองไฟล์ใน Python นอกจากนี้ คุณได้เห็นวิธีการเปิดหรือปิดตัวเลือกการเปรียบเทียบต่างๆ สำหรับไฟล์ PDF แบบไดนามิก ดังนั้น คุณสามารถสร้างแอปพลิเคชันตัวตรวจสอบความแตกต่างของ PDF ใน Python ได้อย่างง่ายดาย
สำรวจไลบรารีเปรียบเทียบ PDF ของ Aspose สำหรับ Python
คุณสามารถสำรวจ เอกสารประกอบ ของไลบรารีที่เราใช้ในบทความนี้เพื่อสำรวจคุณลักษณะที่มีประโยชน์อื่นๆ ในกรณีที่มีคำถาม คุณสามารถถามเราได้ที่ ฟอรัม