Remover marca d'água para PDF em Python

As marcas d’água em arquivos PDF são usadas para inserir logotipos, marcas registradas ou um trecho de texto nas páginas. O objetivo da marca d’água pode ser proteger informações confidenciais, reivindicar direitos autorais, etc. Ao processar arquivos PDF programaticamente, muitas vezes você precisa remover as marcas d’água adicionadas às páginas PDF. Para conseguir isso, este artigo mostra como remover marcas d’água de um PDF em Python.

Biblioteca Python para remover marcas d’água em PDF

Para remover marcas d’água de arquivos PDF, usaremos Aspose.PDF for Python. É uma poderosa biblioteca de manipulação de PDF que permite adicionar e remover marcas d’água de PDF em algumas etapas simples. Você pode instalar a biblioteca usando o seguinte comando pip.

pip install aspose-pdf

Remover marca d’água de um PDF em Python

Em um arquivo PDF, as marcas d’água são representadas como artefatos. Portanto, para remover marcas d’água, teremos que acessar os artefatos em cada página do PDF. A seguir estão as etapas para remover marcas d’água de um PDF em Python.

  • Primeiro, carregue o arquivo PDF usando a classe Document.
  • Em seguida, crie um array para manter as referências dos artefatos a serem removidos.
  • Percorra cada página do PDF usando a coleção Document.pages e, em cada iteração, execute as seguintes etapas:
    • Acesse cada artefato da página da coleção Page.artifacts.
    • Verifique se o tipo do artefato é Artifact.artifactsubtype.WATERMARK.
    • Se sim, adicione o artefato à matriz.
  • Por fim, percorra os artefatos a serem excluídos e remova cada artefato usando o método Page.artifacts.delete().
  • No final, salve o arquivo PDF atualizado usando o método Document.save().

O exemplo de código a seguir mostra como remover marcas d’água de um PDF em Python.

import aspose.pdf as ap

# Carregar arquivo PDF
document = ap.Document("watermarked.pdf")

# Crie uma matriz para manter marcas d'água
artifactsToBeDeleted = []

# Percorra todas as páginas
for page in document.pages:

    # Acesse cada artefato na página
   for item in page.artifacts:

        # Verifique se o artefato é uma marca d'água
        if item.sub_type == ap.Artifact.artifact_subtype.WATERMARK:

            # Manter referência no array
            artifactsToBeDeleted.add(item)

    # Percorra os artefatos de marca d'água
   for item in artifactsToBeDeleted:
        # Excluir o artefato
        page.artifacts.delete(item)

# Salve o arquivo PDF resultante
document.save("Output.pdf")

Arquivos PDF com marca d’água on-line

Experimente nossa ferramenta on-line gratuita para marca d’água em PDF, desenvolvida usando o Aspose.PDF. Você pode usar esta ferramenta sem criar uma conta.

Obtenha uma licença gratuita

Obtenha uma licença temporária gratuita e experimente o recurso de remoção de marca d’água sem quaisquer limitações.

Explorar biblioteca de PDF do Python

Explore outros recursos do Aspose.PDF para Python usando a documentação. Caso você tenha alguma dúvida ou pergunta, informe-nos através do nosso fórum.

Conclusão

Neste artigo, você aprendeu como remover marcas d’água de arquivos PDF em Python. As diretrizes detalhadas e o exemplo de código Python demonstraram como acessar e remover marcas d’água de cada página em um arquivo PDF. Além disso, fornecemos a você uma ferramenta gratuita de marca d’água de PDF baseada na Web que você pode usar em qualquer lugar e a qualquer momento gratuitamente.

Veja também