在 Python 中去除水印到 PDF

PDF 文件中的水印用於在頁面上插入徽標、商標或一段文本。添加水印的目的可能是保護機密信息、主張版權等。在以編程方式處理 PDF 文件時,您通常必須刪除添加到 PDF 頁面的水印。為此,本文向您展示瞭如何使用 Python 從 PDF 中刪除水印。

去除 PDF 水印的 Python 庫

要從 PDF 文件中刪除水印,我們將使用 Aspose.PDF for Python。它是一個功能強大的 PDF 操作庫,可讓您通過幾個簡單的步驟添加和刪除 PDF 水印。您可以使用以下 pip 命令 安裝庫。

pip install aspose-pdf

在 Python 中去除 PDF 中的水印

在 PDF 文件中,水印表示為人工製品。因此,要去除水印,我們必須訪問 PDF 每一頁上的工件。以下是使用 Python 從 PDF 中去除水印的步驟。

  • 首先,使用 Document 類加載 PDF 文件。
  • 然後,創建一個數組來保存要刪除的工件的引用。
  • 使用 Document.pages 集合遍歷 PDF 的每一頁,並在每次迭代中執行以下步驟:
    • 從 Page.artifacts 集合訪問頁面的每個工件。
    • 檢查工件的類型是否為 Artifact.artifactsubtype.WATERMARK。
    • 如果是,將工件添加到數組中。
  • 最後,遍歷要刪除的工件並使用 Page.artifacts.delete() 方法刪除每個工件。
  • 最後,使用 Document.save() 方法保存更新後的 PDF 文件。

以下代碼示例顯示瞭如何使用 Python 從 PDF 中刪除水印。

import aspose.pdf as ap

# 加載PDF文件
document = ap.Document("watermarked.pdf")

# 創建一個數組來保存水印
artifactsToBeDeleted = []

# 循環遍歷所有頁面
for page in document.pages:

    # 訪問頁面中的每個工件
   for item in page.artifacts:

        # 檢查神器是否是水印
        if item.sub_type == ap.Artifact.artifact_subtype.WATERMARK:

            # 在數組中保留引用
            artifactsToBeDeleted.add(item)

    # 循環遍歷水印工件
   for item in artifactsToBeDeleted:
        # 刪除工件
        page.artifacts.delete(item)

# 保存生成的 PDF 文件
document.save("Output.pdf")

在線水印 PDF 文件

試用我們的PDF 水印免費在線工具,它是使用 Aspose.PDF 開發的。您無需創建帳戶即可使用此工具。

獲得免費許可證

獲取免費的臨時許可證 並嘗試無限制地去除水印功能。

探索 Python PDF 庫

使用 文檔 探索 Aspose.PDF for Python 的其他功能。如果您有任何問題或疑問,請通過我們的論壇 告訴我們。

結論

在本文中,您學習瞭如何使用 Python 去除 PDF 文件中的水印。詳細指南和 Python 代碼示例演示瞭如何訪問和刪除 PDF 文件中每個頁面的水印。此外,我們還為您提供了一個免費的基於 Web 的 PDF 水印工具,您可以隨時隨地免費使用。

也可以看看