As marcas d’água em arquivos PDF são usadas para inserir logotipos, marcas registradas ou um trecho de texto nas páginas. O objetivo da marca d’água pode ser proteger informações confidenciais, reivindicar direitos autorais, etc. Ao processar arquivos PDF programaticamente, muitas vezes você precisa remover as marcas d’água adicionadas às páginas PDF. Para conseguir isso, este artigo mostra como remover marcas d’água de um PDF em Python.
- Biblioteca Python para remover marcas d’água em PDF
- Remover marca d’água de um PDF em Python
- Ferramenta de marca d’água de PDF on-line
Biblioteca Python para remover marcas d’água em PDF
Para remover marcas d’água de arquivos PDF, usaremos Aspose.PDF for Python. É uma poderosa biblioteca de manipulação de PDF que permite adicionar e remover marcas d’água de PDF em algumas etapas simples. Você pode instalar a biblioteca usando o seguinte comando pip.
pip install aspose-pdf
Remover marca d’água de um PDF em Python
Em um arquivo PDF, as marcas d’água são representadas como artefatos. Portanto, para remover marcas d’água, teremos que acessar os artefatos em cada página do PDF. A seguir estão as etapas para remover marcas d’água de um PDF em Python.
- Primeiro, carregue o arquivo PDF usando a classe Document.
- Em seguida, crie um array para manter as referências dos artefatos a serem removidos.
- Percorra cada página do PDF usando a coleção Document.pages e, em cada iteração, execute as seguintes etapas:
- Acesse cada artefato da página da coleção Page.artifacts.
- Verifique se o tipo do artefato é Artifact.artifactsubtype.WATERMARK.
- Se sim, adicione o artefato à matriz.
- Por fim, percorra os artefatos a serem excluídos e remova cada artefato usando o método Page.artifacts.delete().
- No final, salve o arquivo PDF atualizado usando o método Document.save().
O exemplo de código a seguir mostra como remover marcas d’água de um PDF em Python.
import aspose.pdf as ap
# Carregar arquivo PDF
document = ap.Document("watermarked.pdf")
# Crie uma matriz para manter marcas d'água
artifactsToBeDeleted = []
# Percorra todas as páginas
for page in document.pages:
# Acesse cada artefato na página
for item in page.artifacts:
# Verifique se o artefato é uma marca d'água
if item.sub_type == ap.Artifact.artifact_subtype.WATERMARK:
# Manter referência no array
artifactsToBeDeleted.add(item)
# Percorra os artefatos de marca d'água
for item in artifactsToBeDeleted:
# Excluir o artefato
page.artifacts.delete(item)
# Salve o arquivo PDF resultante
document.save("Output.pdf")
Arquivos PDF com marca d’água on-line
Experimente nossa ferramenta on-line gratuita para marca d’água em PDF, desenvolvida usando o Aspose.PDF. Você pode usar esta ferramenta sem criar uma conta.
Obtenha uma licença gratuita
Obtenha uma licença temporária gratuita e experimente o recurso de remoção de marca d’água sem quaisquer limitações.
Explorar biblioteca de PDF do Python
Explore outros recursos do Aspose.PDF para Python usando a documentação. Caso você tenha alguma dúvida ou pergunta, informe-nos através do nosso fórum.
Conclusão
Neste artigo, você aprendeu como remover marcas d’água de arquivos PDF em Python. As diretrizes detalhadas e o exemplo de código Python demonstraram como acessar e remover marcas d’água de cada página em um arquivo PDF. Além disso, fornecemos a você uma ferramenta gratuita de marca d’água de PDF baseada na Web que você pode usar em qualquer lugar e a qualquer momento gratuitamente.