Удалить водяной знак в PDF в Python

Водяные знаки в файлах PDF используются для вставки логотипов, торговых марок или фрагментов текста на страницы. Целью водяных знаков может быть защита конфиденциальной информации, защита авторских прав и т. д. При программной обработке файлов PDF часто приходится удалять водяные знаки, добавленные на страницы PDF. Для этого в этой статье показано, как удалить водяные знаки из PDF-файла в Python.

Библиотека Python для удаления водяных знаков в PDF

Чтобы удалить водяные знаки из файлов PDF, мы будем использовать Aspose.PDF for Python. Это мощная библиотека для работы с PDF, которая позволяет добавлять и удалять водяные знаки PDF за несколько простых шагов. Вы можете установить библиотеку, используя следующую команду pip.

pip install aspose-pdf

Удалить водяной знак из PDF в Python

В файле PDF водяные знаки представлены в виде артефактов. Поэтому для удаления водяных знаков нам придется обращаться к артефактам на каждой странице PDF. Ниже приведены шаги по удалению водяных знаков из PDF-файла в Python.

  • Сначала загрузите файл PDF с помощью класса Document.
  • Затем создайте массив для хранения ссылок на удаляемые артефакты.
  • Прокрутите каждую страницу PDF-файла, используя коллекцию Document.pages, и в каждой итерации выполните следующие шаги:
    • Доступ к каждому артефакту страницы из коллекции Page.artifacts.
    • Проверьте, является ли тип артефакта Artifact.artifactsubtype.WATERMARK.
    • Если да, добавьте артефакт в массив.
  • Наконец, прокрутите артефакты, которые нужно удалить, и удалите каждый артефакт, используя метод Page.artifacts.delete().
  • В конце сохраните обновленный файл PDF с помощью метода Document.save().

В следующем примере кода показано, как удалить водяные знаки из PDF-файла в Python.

import aspose.pdf as ap

# Загрузить PDF-файл
document = ap.Document("watermarked.pdf")

# Создайте массив для хранения водяных знаков
artifactsToBeDeleted = []

# Перебрать все страницы
for page in document.pages:

    # Доступ к каждому артефакту на странице
   for item in page.artifacts:

        # Проверить, является ли артефакт водяным знаком
        if item.sub_type == ap.Artifact.artifact_subtype.WATERMARK:

            # Сохранить ссылку в массиве
            artifactsToBeDeleted.add(item)

    # Перебрать артефакты водяных знаков
   for item in artifactsToBeDeleted:
        # Удалить артефакт
        page.artifacts.delete(item)

# Сохраните полученный PDF-файл
document.save("Output.pdf")

Водяной знак PDF-файлы онлайн

Попробуйте наш бесплатный онлайн-инструмент для создания водяных знаков в PDF, разработанный с использованием Aspose.PDF. Вы можете использовать этот инструмент без создания учетной записи.

Получить бесплатную лицензию

Получите бесплатную временную лицензию и попробуйте функцию удаления водяных знаков без каких-либо ограничений.

Изучите библиотеку Python PDF

Изучите другие возможности Aspose.PDF for Python, используя документацию. Если у вас возникнут какие-либо вопросы или вопросы, сообщите нам об этом через наш форум.

Заключение

В этой статье вы узнали, как удалить водяные знаки из файлов PDF в Python. Подробные рекомендации и пример кода Python продемонстрировали, как получить доступ к водяным знакам и удалить их с каждой страницы в файле PDF. Кроме того, мы предоставили вам бесплатный веб-инструмент для создания водяных знаков в формате PDF, который вы можете использовать в любом месте в любое время бесплатно.

Смотрите также