Python знаходить і замінює текст у PDF

Якщо ви шукаєте простий, але точний спосіб пошуку та заміни тексту в PDF-файлах, ви потрапили в потрібне місце. У цій статті ви дізнаєтеся, як замінити певний текст у PDF за допомогою Python. Написавши кілька рядків коду, ви можете проаналізувати весь PDF-файл для пошуку та заміни потрібних слів/фраз.

Бібліотека Python для пошуку та заміни тексту в PDF

Щоб знайти та замінити текст у файлах PDF, ми будемо використовувати Aspose.PDF for Python. Це надійна бібліотека Python для створення та обробки файлів PDF без зусиль. Бібліотека також дозволяє знаходити та замінювати текст у PDF-файлах з високою точністю та швидкістю.

Щоб установити бібліотеку, ви можете використати таку команду pip.

> pip install aspose-pdf

Знайти та замінити текст у PDF за допомогою Python

Наступні кроки пояснюють, як знайти та замінити текст у документі PDF за допомогою Python за допомогою Aspose.PDF.

  1. Завантажте PDF із його шляху за допомогою класу Document.
  2. Створіть екземпляр класу TextFragmentAbsorber і надайте пошукову фразу його конструктору.
  3. Прийміть поглинач тексту для всіх сторінок PDF-файлу за допомогою doc.pages.accept(textabsorber).
  4. Зберіть витягнуті фрагменти тексту в об’єкт.
  5. Перегляньте знайдені фрагменти тексту та замініть текст у кожному фрагменті.
  6. Нарешті збережіть оновлений PDF-документ за допомогою методу Document.save().

У наведеному нижче прикладі коду показано, як знайти та замінити текст у PDF за допомогою Python.

# Завантажте документ PDF
document = ap.Document("input.pdf")

# Створення екземпляра об’єкта TextFragmentAbsorber
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")

# Пошуковий текст
document.pages.accept(txtAbsorber)

# Отримати посилання на знайдені фрагменти тексту
textFragmentCollection = txtAbsorber.text_fragments

# Проаналізуйте всі шукані фрагменти тексту та замініть текст
for txtFragment in textFragmentCollection:
    txtFragment.text = "replaced-text"

# Збережіть оновлений PDF
document.save("output.pdf")

Онлайн-інструмент для заміни тексту в PDF

Ми також розробили онлайн-інструмент для заміни тексту в PDF-файлах, який базується на Aspose.PDF for Python. Ви можете використовувати цей інструмент з будь-якого місця в будь-який час, лише маючи підключення до Інтернету.

Безкоштовна бібліотека Python для заміни тексту в PDF

Ви можете отримати безкоштовну тимчасову ліцензію і замінювати текст у файлах PDF без будь-яких обмежень.

Крім того, ви можете досліджувати інші функції бібліотеки Python PDF за допомогою документації. Також пишіть нам на нашому форумі про свої проблеми, пропозиції чи відгуки.

Висновок

У цій статті ви навчилися аналізувати PDF-файл, знаходити й замінювати певний текст за допомогою Python. За допомогою кількох рядків коду ви можете шукати та замінювати текст у пакеті PDF-файлів. Крім того, ми надали вам безкоштовний онлайн-інструмент для заміни тексту у файлах PDF. Ви можете використовувати цей інструмент з будь-якого пристрою, підключеного до Інтернету.

Дивись також