เปรียบเทียบเอกสาร Word, PDF และ PPT ใน Python

การเปรียบเทียบเอกสารถือเป็นงานสำคัญในอุตสาหกรรมต่างๆ ตั้งแต่การตรวจสอบทางกฎหมายไปจนถึงการแก้ไขทางเทคนิค การรับรองความถูกต้องแม่นยำและการระบุการเปลี่ยนแปลงในเอกสารเวอร์ชันต่างๆ อาจทำให้ปวดหัวได้ ไม่ว่าจะเป็นการเปรียบเทียบเอกสาร Word เวอร์ชันต่างๆ การวิเคราะห์การเปลี่ยนแปลงในไฟล์ PDF หรือการระบุความคลาดเคลื่อนในงานนำเสนอ PowerPoint การเปรียบเทียบเอกสารถือเป็นส่วนสำคัญของกระบวนการพัฒนา ในบทความบล็อกนี้ เราจะสำรวจวิธีเปรียบเทียบ Word (DOC หรือ DOCX), PDF และ PowerPoint (PPT หรือ PPTX) เอกสารใน Python

API การเปรียบเทียบเอกสาร Python

Aspose เชี่ยวชาญในการสร้าง API การประมวลผลเอกสารสำหรับนักพัฒนาเพื่อทำงานกับไฟล์รูปแบบต่างๆ โดยไม่ต้องอาศัยซอฟต์แวร์ภายนอกเช่น Microsoft Office API ช่วยให้นักพัฒนาสามารถสร้าง แก้ไข แปลง และเรนเดอร์ไฟล์ได้หลากหลายประเภท ซึ่งรวมถึงรูปแบบเอกสารทั่วไป เช่น Word, Excel, PowerPoint และ PDF แต่ยังขยายไปยังรูปภาพ ไฟล์เก็บถาวร (ZIP) และแม้แต่รูปแบบ CAD บางรูปแบบ ฟังก์ชันสำคัญประการหนึ่งที่ API เหล่านี้มีให้คือการเปรียบเทียบเอกสาร ซึ่งช่วยระบุความแตกต่างระหว่างเอกสารสองฉบับได้อย่างรวดเร็ว

มาดูวิธีเปรียบเทียบเอกสาร Word, PDF และ PowerPoint ในแอปพลิเคชัน Python กัน

เปรียบเทียบเอกสาร PDF ใน Python

API การเปรียบเทียบ Python PDF

การเปรียบเทียบเอกสาร PDF อาจเป็นเรื่องที่ท้าทายเนื่องจากความซับซ้อนของรูปแบบไฟล์ อย่างไรก็ตาม Aspose.Words for Python เป็น API การประมวลผลเอกสารที่มีประสิทธิภาพซึ่งช่วยให้นักพัฒนาสามารถเปรียบเทียบเอกสาร PDF ได้อย่างมีประสิทธิภาพ มันทำให้วิธีที่คุณทำงานกับเอกสารทางโปรแกรมง่ายขึ้น มาดูขั้นตอนการเปรียบเทียบไฟล์ PDF สองไฟล์ใน Python กัน

  1. ติดตั้ง Aspose.Words for Python ผ่าน .NET
  2. โหลดไฟล์ PDF ทั้งสองไฟล์โดยใช้คลาส Document
  3. แปลงไฟล์ PDF เป็นรูปแบบ Word ที่แก้ไขได้
  4. ทางเลือก ระบุตัวเลือกการเปรียบเทียบที่ต้องการโดยใช้คลาส CompareOptions
  5. โหลดไฟล์ที่แปลงแล้วและเปรียบเทียบโดยใช้เมธอด Document.compare()
  6. สุดท้าย ให้บันทึก PDF ที่มีผลการเปรียบเทียบโดยใช้เมธอด Document.save()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีเปรียบเทียบเอกสาร PDF ใน Python

# ตัวอย่างโค้ดนี้สาธิตวิธีเปรียบเทียบไฟล์ PDF สองไฟล์ใน Python
import aspose.words as aw
from datetime import date

# โหลดไฟล์ PDF
PDF1 = aw.Document("Document.pdf")
PDF2 = aw.Document("Document2.pdf")

# แปลงไฟล์ PDF เป็นรูปแบบ Word
PDF1.save("first.docx", aw.SaveFormat.DOCX)
PDF2.save("second.docx", aw.SaveFormat.DOCX)

# โหลดเอกสาร Word ที่แปลงแล้ว 
DOC1 = aw.Document("first.docx")
DOC2 = aw.Document("second.docx")

# ตั้งค่าตัวเลือกการเปรียบเทียบ
options = aw.comparing.CompareOptions()            
options.ignore_formatting = True
options.ignore_headers_and_footers = True
options.ignore_case_changes = True
options.ignore_tables = True
options.ignore_fields = True
options.ignore_comments = True
options.ignore_textboxes = True
options.ignore_footnotes = True

# DOC1 จะมีการเปลี่ยนแปลงเป็นการแก้ไขหลังการเปรียบเทียบ
DOC1.compare(DOC2, "user", date.today(), options)

if (DOC1.revisions.count > 0):
    # บันทึกไฟล์ผลลัพธ์เป็น PDF
    DOC1.save("compared.pdf", aw.SaveFormat.PDF)
else:
    print("Documents are equal")

เริ่มต้นใช้งาน API การประมวลผลเอกสาร Python โดยใช้ทรัพยากรที่ระบุด้านล่าง:

เปรียบเทียบเอกสาร Word ใน Python

API การเปรียบเทียบคำ Python

สำหรับการเปรียบเทียบเอกสาร Word เราจะใช้ API การประมวลผลเอกสารเดียวกันกับที่เราใช้ด้านบน: Aspose.Words for Python มาดูขั้นตอนในการเปรียบเทียบเอกสาร Word สองเอกสารใน Python กัน

  1. ติดตั้ง Aspose.Words for Python ผ่าน .NET
  2. โหลดเอกสาร Word ทั้งสองโดยใช้คลาสเอกสาร
  3. เรียกเมธอด Document.compare() เพื่อเปรียบเทียบเอกสาร
  4. สุดท้าย ให้บันทึกเอกสารที่มีผลการเปรียบเทียบโดยใช้เมธอด Document.save()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีเปรียบเทียบเอกสาร Word สองเอกสารใน Python

# ตัวอย่างโค้ดนี้สาธิตวิธีการเปรียบเทียบไฟล์ Word สองไฟล์ใน Python
import aspose.words as aw
from datetime import date

# โหลดเอกสารฉบับแรก
doc = aw.Document("Document.docx")

# โหลดเอกสารที่สอง
doc2 = aw.Document("Document2.docx")

# เปรียบเทียบเอกสาร
doc.compare(doc2, "user", date.today())

# บันทึกเอกสารเพื่อรับการแก้ไข
if (doc.revisions.count > 0):
    doc.save("Compared_Document.docx")
else:
    print("Documents are equal")

เปรียบเทียบสไลด์ PPT ใน Python

API การเปรียบเทียบ Python PowerPoint

เราจะใช้ Aspose.Slides for Python API เพื่อเปรียบเทียบสไลด์การนำเสนอ PowerPoint เป็นไลบรารีอันทรงพลังที่ช่วยให้คุณทำงานกับงานนำเสนอใน Python ได้ ต่อไปนี้เป็นขั้นตอนในการเปรียบเทียบสไลด์ในงานนำเสนอ PowerPoint สองรายการ

  1. ติดตั้ง Aspose.Slides for Python ผ่าน .NET
  2. โหลดไฟล์ PPT ต้นฉบับและเป้าหมายโดยใช้คลาสการนำเสนอ
  3. วนซ้ำสไลด์ของไฟล์ PPT ต้นฉบับ
  4. จากนั้น สร้างลูปแบบซ้อนสำหรับสไลด์ในไฟล์ PPT เป้าหมาย
  5. ตรวจสอบว่าสไลด์เท่ากันหรือไม่

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการเปรียบเทียบสไลด์จากไฟล์ PowerPoint PPT สองไฟล์ใน Python

# ตัวอย่างโค้ดนี้สาธิตวิธีการเปรียบเทียบสองสไลด์การนำเสนอ PowerPoint ใน Python
import aspose.slides as slides

with slides.Presentation("AccessSlides.pptx") as p1:
    with slides.Presentation("HelloWorld.pptx") as p2:
       for i in range(len(p1.masters)):
           for j in range(len(p2.masters)):
                if p1.masters[i] == p2.masters[j]:
                    print("Presentation1 MasterSlide#{0} is equal to Presentation2 MasterSlide#{1}".format(i,j))
                else:
                    print("Presentation1 MasterSlide#{0} is not equal to Presentation2 MasterSlide#{1}".format(i,j))

เรียนรู้เพิ่มเติมเกี่ยวกับ Python PowerPoint การประมวลผล API และสำรวจคุณสมบัติอื่นๆ ของ API โดยใช้แหล่งข้อมูลด้านล่าง:

สรุป

โดยสรุป Aspose นำเสนอ API การประมวลผลเอกสารอันทรงพลังมากมายที่สามารถใช้เพื่อเปรียบเทียบเอกสาร Word, PDF และ PPT ได้อย่างมีประสิทธิภาพ ด้วยการใช้ประโยชน์จากความสามารถของไลบรารีเหล่านี้ นักพัฒนาซอฟต์แวร์จึงสามารถปรับปรุงกระบวนการเปรียบเทียบเอกสารและรับประกันความถูกต้องและสม่ำเสมอของงานของพวกเขา ในบทความนี้ เราได้แนะนำคุณตลอดกระบวนการเปรียบเทียบเอกสารในรูปแบบ Word, PDF และ PPT โดยใช้ Python คุณสามารถปฏิบัติตามแนวทางที่ให้ไว้ได้อย่างง่ายดายและรวมการเปรียบเทียบเอกสารเข้ากับแอปพลิเคชัน Python ของคุณ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราที่ ฟอรัมการสนับสนุนฟรี