Eliminar marca de agua a PDF en Python

Las marcas de agua en los archivos PDF se utilizan para insertar logotipos, marcas comerciales o un fragmento de texto en las páginas. El propósito de la marca de agua podría ser proteger la información confidencial, hacer valer los derechos de autor, etc. Mientras procesa archivos PDF mediante programación, a menudo tiene que eliminar las marcas de agua agregadas a las páginas PDF. Para lograr eso, este artículo le muestra cómo eliminar marcas de agua de un PDF en Python.

Biblioteca de Python para eliminar marcas de agua en PDF

Para eliminar las marcas de agua de los archivos PDF, usaremos Aspose.PDF for Python. Es una poderosa biblioteca de manipulación de PDF que le permite agregar y eliminar marcas de agua de PDF en unos pocos pasos simples. Puede instalar la biblioteca usando el siguiente comando pip.

pip install aspose-pdf

Eliminar marca de agua de un PDF en Python

En un archivo PDF, las marcas de agua se representan como artefactos. Por tanto, para eliminar marcas de agua, tendremos que acceder a artefactos en cada página del PDF. Los siguientes son los pasos para eliminar marcas de agua de un PDF en Python.

  • Primero, cargue el archivo PDF usando la clase Document.
  • Luego, cree una matriz para mantener las referencias de los artefactos que se eliminarán.
  • Recorra cada página del PDF usando la colección Document.pages y en cada iteración, realice los siguientes pasos:
    • Acceda a cada artefacto de la página desde la colección Page.artifacts.
    • Compruebe si el tipo de artefacto es Artifact.artifactsubtype.WATERMARK.
    • En caso afirmativo, agregue el artefacto a la matriz.
  • Finalmente, recorra los artefactos que se eliminarán y elimine cada artefacto usando el método Page.artifacts.delete().
  • Al final, guarde el archivo PDF actualizado usando el método Document.save().

El siguiente ejemplo de código muestra cómo eliminar marcas de agua de un PDF en Python.

import aspose.pdf as ap

# Cargar archivo PDF
document = ap.Document("watermarked.pdf")

# Crear una matriz para mantener las marcas de agua
artifactsToBeDeleted = []

# Recorrer todas las páginas
for page in document.pages:

    # Accede a cada artefacto en la página
   for item in page.artifacts:

        # Comprobar si el artefacto es una marca de agua
        if item.sub_type == ap.Artifact.artifact_subtype.WATERMARK:

            # Mantener la referencia en la matriz
            artifactsToBeDeleted.add(item)

    # Bucle a través de los artefactos de marca de agua
   for item in artifactsToBeDeleted:
        # Eliminar el artefacto
        page.artifacts.delete(item)

# Guarde el archivo PDF resultante
document.save("Output.pdf")

Archivos PDF de marca de agua en línea

Pruebe nuestra herramienta en línea gratuita para la marca de agua de PDF, que se desarrolla con Aspose.PDF. Puede utilizar esta herramienta sin crear una cuenta.

Obtenga una licencia gratis

Obtenga una licencia temporal gratuita y pruebe la función de eliminación de marcas de agua sin ninguna limitación.

Explore la biblioteca PDF de Python

Explore otras funciones de Aspose.PDF for Python utilizando la documentación. En caso de que tenga alguna pregunta o consulta, háganoslo saber a través de nuestro foro.

Conclusión

En este artículo, ha aprendido a eliminar marcas de agua de archivos PDF en Python. Las pautas detalladas y la muestra de código de Python han demostrado cómo acceder y eliminar marcas de agua de cada página en un archivo PDF. Además, le proporcionamos una herramienta gratuita de marca de agua de PDF basada en la web que puede usar en cualquier lugar y en cualquier momento de forma gratuita.

Ver también