Python에서 PDF의 워터마크 제거

PDF 파일의 워터마크는 페이지에 로고, 상표 또는 텍스트를 삽입하는 데 사용됩니다. 워터마크의 목적은 기밀 정보 보호, 저작권 주장 등일 수 있습니다. 프로그래밍 방식으로 PDF 파일을 처리하는 동안 PDF 페이지에 추가된 워터마크를 제거해야 하는 경우가 많습니다. 이를 달성하기 위해 이 기사에서는 Python의 PDF에서 워터마크를 제거하는 방법을 보여줍니다.

PDF에서 워터마크를 제거하는 Python 라이브러리

PDF 파일에서 워터마크를 제거하려면 Aspose.PDF for Python을 사용합니다. 몇 가지 간단한 단계로 PDF 워터마크를 추가하고 제거할 수 있는 강력한 PDF 조작 라이브러리입니다. 다음 pip 명령을 사용하여 라이브러리를 설치할 수 있습니다.

pip install aspose-pdf

Python의 PDF에서 워터마크 제거

PDF 파일에서 워터마크는 아티팩트로 표시됩니다. 따라서 워터마크를 제거하려면 PDF의 각 페이지에서 아티팩트에 액세스해야 합니다. 다음은 Python에서 PDF에서 워터마크를 제거하는 단계입니다.

  • 먼저 Document 클래스를 사용하여 PDF 파일을 로드합니다.
  • 그런 다음 제거할 아티팩트의 참조를 유지할 배열을 만듭니다.
  • Document.pages 컬렉션을 사용하여 PDF의 각 페이지를 반복하고 각 반복에서 다음 단계를 수행합니다.
    • Page.artifacts 컬렉션에서 페이지의 각 아티팩트에 액세스합니다.
    • 아티팩트 유형이 Artifact.artifactsubtype.WATERMARK인지 확인합니다.
    • 그렇다면 어레이에 아티팩트를 추가합니다.
  • 마지막으로 삭제할 아티팩트를 반복하고 Page.artifacts.delete() 메서드를 사용하여 각 아티팩트를 제거합니다.
  • 마지막에 Document.save() 메서드를 사용하여 업데이트된 PDF 파일을 저장합니다.

다음 코드 샘플은 Python의 PDF에서 워터마크를 제거하는 방법을 보여줍니다.

import aspose.pdf as ap

# PDF 파일 로드
document = ap.Document("watermarked.pdf")

# 워터마크를 유지하기 위한 배열 만들기
artifactsToBeDeleted = []

# 모든 페이지 반복
for page in document.pages:

    # 페이지의 각 아티팩트에 액세스
   for item in page.artifacts:

        # 아티팩트가 워터마크인지 확인
        if item.sub_type == ap.Artifact.artifact_subtype.WATERMARK:

            # 참조를 배열로 유지
            artifactsToBeDeleted.add(item)

    # 워터마크 아티팩트를 통한 루프
   for item in artifactsToBeDeleted:
        # 아티팩트 삭제
        page.artifacts.delete(item)

# 결과 PDF 파일 저장
document.save("Output.pdf")

워터마크 PDF 파일 온라인

Aspose.PDF를 사용하여 개발된 PDF 워터마킹을 위한 무료 온라인 도구를 사용해 보십시오. 계정을 만들지 않고도 이 도구를 사용할 수 있습니다.

무료 라이선스 받기

무료 임시 라이선스를 받아 제한 없이 워터마크 제거 기능을 사용해 보세요.

Python PDF 라이브러리 살펴보기

문서를 사용하여 Python용 Aspose.PDF의 다른 기능을 살펴보십시오. 질문이나 쿼리가 있는 경우 포럼을 통해 알려주십시오.

결론

이 기사에서는 Python의 PDF 파일에서 워터마크를 제거하는 방법을 배웠습니다. 자세한 지침과 Python 코드 샘플은 PDF 파일의 각 페이지에서 워터마크에 액세스하고 제거하는 방법을 보여줍니다. 또한 언제 어디서나 무료로 사용할 수 있는 무료 웹 기반 PDF 워터마킹 도구를 제공했습니다.

또한보십시오