پایتون متن را در PDF پیدا و جایگزین می کند

اگر به دنبال راهی ساده و در عین حال دقیق برای یافتن و جایگزینی متن در فایل‌های PDF هستید، به جای درستی آمده‌اید. در این مقاله یاد خواهید گرفت که چگونه با استفاده از پایتون یک متن خاص را در PDF جایگزین کنید. با نوشتن چند خط کد می توانید کل PDF را برای جستجو و جایگزینی کلمات / عبارات مورد نظر تجزیه کنید.

کتابخانه پایتون برای یافتن و جایگزینی متن در PDF

برای یافتن و جایگزینی متن در فایل‌های PDF، از Aspose.PDF برای پایتون استفاده می‌کنیم. این یک کتابخانه قوی پایتون برای ایجاد و پردازش فایل های PDF بدون زحمت است. این کتابخانه همچنین به شما این امکان را می دهد که متن فایل های PDF را با دقت و سرعت بالا پیدا و جایگزین کنید.

برای نصب کتابخانه می توانید از دستور pip زیر استفاده کنید.

> pip install aspose-pdf

یافتن و جایگزینی متن در PDF با استفاده از پایتون

مراحل زیر نحوه یافتن و جایگزینی متن در یک سند PDF را با استفاده از پایتون با کمک Aspose.PDF توضیح می دهد.

  1. PDF را از مسیر خود با استفاده از کلاس Document بارگیری کنید.
  2. یک نمونه از کلاس TextFragmentAbsorber ایجاد کنید و عبارت جستجو را در اختیار سازنده آن قرار دهید.
  3. جذب متن را برای تمام صفحات PDF با استفاده از doc.pages.accept(textabsorber) بپذیرید.
  4. قطعات متن استخراج شده را در یک شیء دریافت کنید.
  5. قطعات متن یافت شده را حلقه بزنید و متن را در هر قطعه جایگزین کنید.
  6. در نهایت، سند PDF به روز شده را با استفاده از روش ()Document.save ذخیره کنید.

نمونه کد زیر نحوه یافتن و جایگزینی متن در PDF را با استفاده از پایتون نشان می دهد.

# سند PDF را بارگیری کنید
document = ap.Document("input.pdf")

# نمونه سازی یک شی TextFragmentAbsorber
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")

# جستجوی متن
document.pages.accept(txtAbsorber)

# ارجاع به قطعات متن یافت شده را دریافت کنید
textFragmentCollection = txtAbsorber.text_fragments

# تمام قطعات متن جستجو شده را تجزیه کنید و متن را جایگزین کنید
for txtFragment in textFragmentCollection:
    txtFragment.text = "replaced-text"

# PDF به روز شده را ذخیره کنید
document.save("output.pdf")

ابزار آنلاین برای جایگزینی متن در PDF

ما همچنین یک ابزار آنلاین برای جایگزینی متن در فایل‌های PDF ایجاد کرده‌ایم که بر اساس Aspose.PDF برای پایتون است. شما می توانید از این ابزار در هر مکان و در هر زمان و تنها با داشتن اتصال به اینترنت استفاده کنید.

کتابخانه رایگان پایتون برای جایگزینی متن در PDF

می‌توانید یک مجوز موقت رایگان دریافت کنید و بدون هیچ محدودیتی متن را در فایل‌های PDF جایگزین کنید.

علاوه بر این، می‌توانید سایر ویژگی‌های کتابخانه PDF Python را با استفاده از مستندات کاوش کنید. همچنین، در مورد مشکلات، پیشنهادات یا بازخورد خود در تالار گفتمان ما برای ما بنویسید.

نتیجه

در این مقاله، نحوه تجزیه یک PDF و یافتن و جایگزینی یک متن خاص با استفاده از پایتون را یاد گرفتید. در چند خط کد، می توانید متن را در دسته ای از فایل های PDF جستجو و جایگزین کنید. علاوه بر این، ما یک ابزار آنلاین رایگان برای جایگزینی متن در فایل های PDF در اختیار شما قرار داده ایم. از هر دستگاهی که به اینترنت متصل است می توانید از این ابزار استفاده کنید.

همچنین ببینید