在 Python 中去除水印到 PDF

PDF 文件中的水印用于在页面上插入徽标、商标或一段文本。添加水印的目的可能是保护机密信息、主张版权等。在以编程方式处理 PDF 文件时,您通常必须删除添加到 PDF 页面的水印。为此,本文向您展示了如何使用 Python 从 PDF 中删除水印。

去除 PDF 水印的 Python 库

要从 PDF 文件中删除水印,我们将使用 Aspose.PDF for Python。它是一个功能强大的 PDF 操作库,可让您通过几个简单的步骤添加和删除 PDF 水印。您可以使用以下 pip 命令 安装库。

pip install aspose-pdf

在 Python 中去除 PDF 中的水印

在 PDF 文件中,水印表示为人工制品。因此,要去除水印,我们必须访问 PDF 每一页上的工件。以下是使用 Python 从 PDF 中去除水印的步骤。

  • 首先,使用 Document 类加载 PDF 文件。
  • 然后,创建一个数组来保存要删除的工件的引用。
  • 使用 Document.pages 集合遍历 PDF 的每一页,并在每次迭代中执行以下步骤:
    • 从 Page.artifacts 集合访问页面的每个工件。
    • 检查工件的类型是否为 Artifact.artifactsubtype.WATERMARK。
    • 如果是,则将工件添加到数组中。
  • 最后,遍历要删除的工件并使用 Page.artifacts.delete() 方法删除每个工件。
  • 最后,使用 Document.save() 方法保存更新后的 PDF 文件。

以下代码示例显示了如何使用 Python 从 PDF 中删除水印。

import aspose.pdf as ap

# 加载PDF文件
document = ap.Document("watermarked.pdf")

# 创建一个数组来保存水印
artifactsToBeDeleted = []

# 循环遍历所有页面
for page in document.pages:

    # 访问页面中的每个工件
   for item in page.artifacts:

        # 检查神器是否是水印
        if item.sub_type == ap.Artifact.artifact_subtype.WATERMARK:

            # 在数组中保留引用
            artifactsToBeDeleted.add(item)

    # 循环遍历水印工件
   for item in artifactsToBeDeleted:
        # 删除工件
        page.artifacts.delete(item)

# 保存生成的 PDF 文件
document.save("Output.pdf")

在线水印 PDF 文件

试用我们的PDF 水印免费在线工具,它是使用 Aspose.PDF 开发的。您无需创建帐户即可使用此工具。

获得免费许可证

获取免费的临时许可证 并尝试无限制地去除水印功能。

探索 Python PDF 库

使用 文档 探索 Aspose.PDF for Python 的其他功能。如果您有任何问题或疑问,请通过我们的论坛 告诉我们。

结论

在本文中,您学习了如何使用 Python 去除 PDF 文件中的水印。详细指南和 Python 代码示例演示了如何访问和删除 PDF 文件中每个页面的水印。此外,我们还为您提供了一个免费的基于 Web 的 PDF 水印工具,您可以随时随地免费使用。

也可以看看