Разделить файл PDF на несколько файлов с помощью Python

В сегодняшнюю цифровую эпоху PDF-файлы стали неотъемлемой частью нашей жизни. Однако иногда нам может понадобиться разделить большой файл PDF на более мелкие по разным причинам, например, для отправки определенных страниц кому-либо или их загрузки на веб-сайт. Похожая ситуация может возникнуть при обработке файлов PDF в Python. Итак, в этой статье мы увидим, как разделить файл PDF в Python. Мы расскажем, как разделить PDF-файлы на каждую страницу или набор страниц.

Библиотека Python для разделения PDF

Для разделения файлов PDF мы будем использовать Aspose.PDF for Python. Это многофункциональная библиотека для работы с PDF, которая позволяет легко создавать, редактировать и обрабатывать PDF-документы. Используйте следующую команду pip, чтобы установить библиотеку в ваше приложение Python.

pip install aspose-pdf

Разделить PDF по страницам в Python

В каждой ситуации могут потребоваться разные критерии разделения PDF, например, разделение каждой страницы в PDF, только выборочные страницы, только четные страницы и т. д. Во-первых, давайте посмотрим, как разделить PDF-файл на каждую страницу в Python. Ниже приведены шаги для выполнения этой операции.

  • Загрузите файл PDF, используя класс Document.
  • Переберите страницы в коллекции Document.pages.
  • В каждой итерации выполните следующие шаги:
    • Создайте новый объект Document и добавьте страницу в документ, используя метод Document.pages.add(Page).
    • Сохраните файл PDF с помощью метода Document.save().

В следующем примере кода показано, как разделить каждую страницу в PDF-файле с помощью Python.

import aspose.pdf as ap

# Загрузить PDF-файл
document = ap.Document("input.pdf")

# Пролистайте каждую страницу
for page in document.pages:
    # Создать новый PDF-файл
    splitPDF = ap.Document()

    # Добавить страницу в PDF
    splitPDF.pages.add(page)

    # Сохранить PDF
    splitPDF.save("Page_" + str(page.number) + ".pdf")

Разделить определенные страницы PDF в Python

Давайте теперь посмотрим, как разделить несколько страниц в PDF и сохранить их в отдельном файле. Ниже приведены шаги для разделения нескольких страниц PDF в Python.

  • Загрузите файл PDF, используя класс Document.
  • Создайте новый объект документа для нового файла PDF.
  • Переберите страницы в коллекции Document.pages.
  • В каждой итерации проверяйте, должна ли страница быть разделена.
  • Добавьте страницу в новый документ PDF, используя метод Document.pages.add(Page).
  • Наконец, сохраните файл PDF с помощью метода Document.save().

В следующем примере кода показано, как разделить коллекцию страниц в PDF-файле с помощью Python.

import aspose.pdf as ap

# Загрузить PDF-файл
document = ap.Document("input.pdf")

# Создать новый PDF-файл
splitPDF = ap.Document()

# Пролистайте каждую страницу
for page in document.pages:
    # Некоторое условие здесь
    if page.number%2==0:
        # Добавить страницу
        splitPDF.pages.add(page)

# Сохранить PDF
splitPDF.save("Split_PDF.pdf")

Разделить PDF-файлы онлайн

Мы также предоставляем бесплатный онлайн-инструмент для разделения PDF-файлов, который основан на Aspose.PDF for Python.

Бесплатная библиотека Python в формате PDF

Вы можете получить бесплатную временную лицензию для разделения файлов PDF без каких-либо ограничений. Кроме того, вы можете посетить документацию, чтобы узнать больше о библиотеке Python PDF.

Заключение

В этой статье вы узнали, как разделить файлы PDF в Python. Вы видели, как разделить каждую страницу или набор страниц в PDF на отдельные файлы. Вы можете легко выполнить предоставленные шаги и примеры кода, чтобы разделить PDF-файлы в своем приложении Python.

Смотрите также