استخراج متن از اسناد PDF به صورت برنامه ریزی شده با استفاده از C++
استخراج متن از اسناد (PDF، واژه پردازی، صفحات وب و …) کاربردهای متنوعی در دنیای اطلاعات دیجیتال دارد. به عنوان مثال، می توان از آن برای تجزیه اسناد، انجام تجزیه و تحلیل متن، بازیابی اطلاعات، ذخیره محتوای اسناد در پایگاه های داده و غیره استفاده کرد. اگر آن را محدود کنیم، PDF یکی از پرکاربردترین قالبهای سند برای نگهداری و اشتراکگذاری اطلاعات دیجیتال است. این محبوبیت اسناد PDF را به منبع عظیمی از اطلاعات تبدیل می کند.