이 기사에서는 PDF 차이 검사기 도구를 만들고 Python에서 두 개의 PDF 파일을 비교하는 방법을 배웁니다.

Python에서 PDF 파일 비교

매우 자주 PDF 문서의 두 버전을 비교하고 내용의 차이점을 확인해야 합니다. 이것은 문서에서 의도적이거나 의도하지 않은 수정을 식별하는 데 필요할 수 있습니다. PDF 파일을 단어 단위로 확인하는 것은 불가능하기 때문에 두 PDF 파일의 차이점을 찾을 수 있는 다양한 온라인 PDF 비교 도구를 사용할 수 있습니다. 그러나 Python 응용 프로그램 내에서 프로그래밍 방식으로 PDF 파일을 비교하려는 경우 이 문서를 통해 몇 가지 간단한 단계를 수행할 수 있습니다.

PDF 파일을 비교하는 Python 라이브러리 - 무료 다운로드

Aspose.Words for Python은 DOC, DOCX 및 PDF를 포함한 텍스트 문서를 만들고 처리하는 강력하면서도 사용하기 쉬운 라이브러리입니다. 라이브러리를 사용하면 문서를 비교하고 문자 수준에서도 변경 사항을 추적할 수 있습니다. 이 기사에서 PDF 파일을 비교하기 위해 이 라이브러리를 사용할 것입니다. PyPI에서 라이브러리를 설치하려면 다음 pip 명령을 사용할 수 있습니다.

> pip install aspose-words

Python에서 PDF 파일을 비교하는 단계

Aspose.Words for Python은 강력한 PDF 비교 메커니즘을 제공하고 차이점을 쉽게 찾을 수 있도록 합니다. 다음은 해당 Python 라이브러리를 사용하여 두 개의 PDF 파일을 비교하는 단계입니다.

  • 두 PDF 파일을 모두 로드합니다.
  • PDF 파일을 Word 형식으로 변환합니다.
  • 두 Word 문서를 비교하여 변경 사항을 가져옵니다.
  • 변경 사항이 포함된 문서를 원하는 위치에 PDF로 저장합니다.

다음 섹션에서는 위에서 언급한 단계를 Python 코드로 변환하고 두 PDF 파일을 비교하는 방법을 볼 수 있습니다.

Python에서 두 개의 PDF 파일 비교

다음은 두 개의 PDF 파일을 비교하고 Python에서 차이점을 확인하는 단계입니다.

  • 먼저 Document 클래스를 사용하여 두 PDF 파일을 모두 로드합니다.
  • 그런 다음 Document.save() 메서드를 사용하여 PDF 파일을 Word DOCX 형식으로 변환합니다.
  • 원하는 CompareOptions를 생성 및 설정하고 Document.compare() 메서드를 사용하여 문서를 비교합니다.
  • 마지막으로 Document.save() 메서드를 사용하여 차이점이 포함된 PDF 파일을 저장합니다.

다음 코드 샘플은 Python에서 PDF 비교를 수행하는 방법을 보여줍니다.

import aspose.words as aw
from datetime import date

# PDF 파일 로드
PDF1 = aw.Document("first.pdf")
PDF2 = aw.Document("second.pdf")

# PDF 파일을 Word 형식으로 변환
PDF1.save("first.docx", aw.SaveFormat.DOCX)
PDF2.save("second.docx", aw.SaveFormat.DOCX)

# 변환된 Word 문서 로드 
DOC1 = aw.Document("first.docx")
DOC2 = aw.Document("second.docx")

# 비교 옵션 설정
options = aw.comparing.CompareOptions()            
options.ignore_formatting = True
options.ignore_headers_and_footers = True
options.ignore_case_changes = True
options.ignore_tables = True
options.ignore_fields = True
options.ignore_comments = True
options.ignore_textboxes = True
options.ignore_footnotes = True

# DOC1은 비교 후 수정 사항으로 변경 사항을 포함합니다.
DOC1.compare(DOC2, "user", date.today(), options)

if (DOC1.revisions.count > 0):
    # 결과 파일을 PDF로 저장
    DOC1.save("compared.pdf", aw.SaveFormat.PDF)
else:
    print("Documents are equal")

다음 스크린샷은 두 PDF 파일의 비교를 보여줍니다.

Python에서 PDF 파일 비교

Python PDF 비교 라이브러리 - 무료 라이선스 받기

평가 제한 없이 PDF 파일을 비교하기 위해 무료 임시 라이센스 받기를 할 수 있습니다.

결론

이 기사에서는 Python에서 두 개의 PDF 파일을 비교하는 방법을 배웠습니다. 또한 PDF 파일에 대한 다양한 비교 옵션을 동적으로 활성화 또는 비활성화하는 방법을 살펴보았습니다. 따라서 Python에서 PDF 차이 검사기 응용 프로그램을 아주 쉽게 만들 수 있습니다.

Aspose의 Python용 PDF 비교 라이브러리 살펴보기

다른 유용한 기능을 탐색하기 위해 이 기사에서 사용한 라이브러리의 문서를 탐색할 수 있습니다. 질문이 있는 경우 포럼을 통해 질문할 수 있습니다.

또한보십시오