Python найти и заменить текст в PDF

Если вы ищете простой, но точный способ поиска и замены текста в файлах PDF, вы попали по адресу. В этой статье вы узнаете, как заменить определенный текст в PDF-файле с помощью Python. Написав несколько строк кода, вы можете проанализировать весь PDF-файл для поиска и замены нужных слов/фраз.

Библиотека Python для поиска и замены текста в PDF

Чтобы найти и заменить текст в файлах PDF, мы будем использовать Aspose.PDF for Python. Это надежная библиотека Python для простого создания и обработки PDF-файлов. Библиотека также позволяет находить и заменять текст в файлах PDF с высокой точностью и скоростью.

Чтобы установить библиотеку, вы можете использовать следующую команду pip.

> pip install aspose-pdf

Найти и заменить текст в PDF с помощью Python

Следующие шаги объясняют, как найти и заменить текст в документе PDF с помощью Python с помощью Aspose.PDF.

  1. Загрузите PDF-файл с его пути, используя класс Document.
  2. Создайте экземпляр класса TextFragmentAbsorber и укажите поисковую фразу в его конструкторе.
  3. Примите поглотитель текста для всех страниц PDF, используя doc.pages.accept(textabsorber).
  4. Получить извлеченные текстовые фрагменты в объект.
  5. Перебрать найденные фрагменты текста и заменить текст в каждом фрагменте.
  6. Наконец, сохраните обновленный PDF-документ с помощью метода Document.save().

В следующем примере кода показано, как найти и заменить текст в PDF с помощью Python.

# Загрузите PDF-документ
document = ap.Document("input.pdf")

# Создание экземпляра объекта TextFragmentAbsorber
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")

# Поиск текста
document.pages.accept(txtAbsorber)

# Получить ссылку на найденные фрагменты текста
textFragmentCollection = txtAbsorber.text_fragments

# Разобрать все найденные фрагменты текста и заменить текст
for txtFragment in textFragmentCollection:
    txtFragment.text = "replaced-text"

# Сохраните обновленный PDF
document.save("output.pdf")

Онлайн-инструмент для замены текста в PDF

Мы также разработали онлайн-инструмент для замены текста в PDF-файлах, основанный на Aspose.PDF for Python. Вы можете использовать этот инструмент из любого места в любое время, только имея подключение к Интернету.

Бесплатная библиотека Python для замены текста в PDF

Вы можете получить бесплатную временную лицензию и заменять текст в файлах PDF без каких-либо ограничений.

Кроме того, вы можете изучить другие функции библиотеки Python PDF, используя документацию. Кроме того, пишите нам на наш форум о своих проблемах, предложениях или отзывах.

Заключение

В этой статье вы узнали, как анализировать PDF-файл, а также находить и заменять определенный текст с помощью Python. С помощью нескольких строк кода вы можете искать и заменять текст в пакете PDF-файлов. Кроме того, мы предоставили вам бесплатный онлайн-инструмент для замены текста в файлах PDF. Вы можете использовать этот инструмент с любого устройства, имеющего подключение к Интернету.

Смотрите также