تبدیل PDF به TXT در سی شارپ

به عنوان یک برنامه نویس، اغلب مجبورید محتوا را از فایل های PDF به عنوان متن ساده برای پردازش بیشتر، مانند تجزیه و تحلیل و استخراج اطلاعات، استخراج کنید. پردازش فایل‌های پی‌دی‌اف و تبدیل کل PDF به فرمت TXT زمانی که ابزار مناسبی ندارید، کاری مشکل‌ساز است. بنابراین در این وبلاگ نحوه تبدیل یک فایل PDF به فرمت TXT به صورت برنامه نویسی در سی شارپ را بررسی خواهیم کرد.

کتابخانه سی شارپ برای تبدیل PDF به TXT

Aspose.Words for .NET یک API پردازش اسناد شگفت انگیز است که به توسعه دهندگان اجازه می دهد با اسناد Word و همچنین فرمت های مختلف دیگر از جمله PDF کار کنند. Aspose.Words با مجموعه گسترده ای از ویژگی های خود، دستکاری اسناد، تبدیل، و وظایف تولید را ساده می کند. ما از این کتابخانه برای تبدیل فایل های PDF به فرمت TXT در یک برنامه دات نت استفاده خواهیم کرد.

با استفاده از دستور زیر می توانید کتابخانه را از NuGet نصب کنید. یا DLL آن را از بخش Releases دانلود کنید.

PM> Install-Package Aspose.Words 

تبدیل PDF به TXT در سی شارپ

Aspose.Words for .NET تمام عملیات پیچیده استخراج متن از فایل های PDF را پنهان می کند و شما را قادر می سازد تا تبدیل PDF به TXT را در چند مرحله انجام دهید، همانطور که در زیر ذکر شده است.

  • فایل PDF را بارگیری کنید.
  • تبدیل PDF به فرمت TXT با یک فراخوانی واحد.

بنابراین، با چند خط کد، می توانید محتوای موجود در یک فایل PDF را به متن ساده تبدیل کنید، مهم نیست که PDF منبع چقدر بزرگ باشد. حالا بیایید کدی را برای انجام این تبدیل در سی شارپ بنویسیم.

  • ابتدا PDF را با استفاده از کلاس Document بارگذاری کنید.
  • سپس با استفاده از روش Document.Save(filePath) سند را به صورت فایل TXT ذخیره کنید.

قطعه کد C# زیر یک PDF را به فرمت TXT تبدیل می کند.

// فایل PDF را بارگیری کنید
Document pdf = new Document("document.pdf");

// PDF را به صورت TXT ذخیره کنید
pdf.Save("pdf.txt", SaveFormat.Text);

مجوز API رایگان دریافت کنید

برای تبدیل فایل‌های PDF به فرمت TXT بدون محدودیت ارزیابی، می‌توانید یک مجوز موقت رایگان دریافت کنید.

نتیجه

در این پست وبلاگ، نحوه تبدیل PDF به TXT در سی شارپ را با استفاده از کتابخانه Aspose.Words برای دات نت بررسی کردیم. با پیروی از دستورالعمل ها و با استفاده از قطعه کد، می توانید به راحتی فایل های PDF بزرگ را پردازش کرده و آنها را به متن ساده تبدیل کنید. Aspose.Words وظایف پردازش اسناد را ساده می کند و آن را به ابزاری ارزشمند برای توسعه دهندگانی تبدیل می کند که با فرمت های اسناد مختلف در برنامه های خود کار می کنند. برای کشف ویژگی‌های شگفت‌انگیز آن، می‌توانید به اسناد این کتابخانه پردازش کلمه دات‌نت مراجعه کنید. در صورت داشتن هرگونه سوال، از طریق [تالار گفتمان4 ما را در جریان بگذارید.

همچنین ببینید