تبدیل Word DOC به TXT در سی شارپ

در حوزه پردازش اسناد، اغلب نیاز به تبدیل اسناد Word به قالب‌های متن ساده‌تر ایجاد می‌شود. چه به دلیل استخراج داده، تجزیه و تحلیل محتوا، یا دلایل سازگاری، توانایی تبدیل فایل های Word (.doc، .docx) به متن ساده (txt.) یک مهارت ارزشمند برای توسعه دهندگان است. در این پست وبلاگ، نحوه تبدیل یک سند Word به فرمت TXT در یک برنامه C# را بررسی خواهیم کرد.

کتابخانه سی شارپ برای تبدیل Word به TXT

Aspose.Words for .NET یک کتابخانه پردازش اسناد با ویژگی های غنی است که توسعه دهندگان را قادر می سازد تا با اسناد Word در قالب های مختلف کار کنند. مجموعه ای از API ها را برای ایجاد، دستکاری، تبدیل و رندر اسناد ارائه می دهد. ما از این کتابخانه برای استخراج محتوا از اسناد Word به صورت متن ساده استفاده خواهیم کرد.

برای نصب کتابخانه از NuGet، می توانید از دستور زیر استفاده کنید. یا می توانید آن را از بخش Releases دانلود کنید.

PM> Install-Package Aspose.Words 

مراحل تبدیل Word DOC به TXT

همانطور که Aspose.Words برای دات نت این کار را بسیار آسان کرده است، می توانید متن را از اسناد Word استخراج کنید و در قالب TXT در چند مرحله ذخیره کنید. در زیر مراحلی که باید برای تبدیل Word به TXT انجام دهیم آورده شده است.

  • فایل Word DOC/DOCX را بارگیری کنید.
  • آن را به فرمت TXT تبدیل کرده و فایل را در محل مورد نظر ذخیره کنید.

بنابراین لازم نیست کل سند Word را تجزیه کنید و متن را خط به خط یا صفحه به صفحه استخراج کنید. حالا بیایید کد سی شارپ را برای استخراج متن از یک سند Word بنویسیم.

تبدیل Word DOC به TXT در سی شارپ

در زیر مراحل ذخیره یک سند Word DOC یا DOCX به عنوان یک فایل TXT در سی شارپ آمده است.

  • ابتدا Word DOC/DOCX را با استفاده از کلاس Document بارگذاری کنید.
  • سپس با استفاده از روش Document.Save(filePath) سند را به صورت فایل TXT ذخیره کنید.

قطعه کد C# زیر یک سند Word را به فرمت TXT تبدیل می کند.

// فایل Word را بارگیری کنید
Document doc = new Document("document.docx");

// سند را به عنوان فایل TXT ذخیره کنید
doc.Save("doc-to-text.txt");

از تبدیل رایگان C# Word به TXT استفاده کنید

برای تبدیل فایل های Word به فرمت TXT بدون محدودیت ارزیابی، می توانید یک مجوز موقت رایگان دریافت کنید.

کتابخانه ورد سی شارپ را کاوش کنید

برای بررسی سایر ویژگی‌ها می‌توانید به اسناد کتابخانه C# Word مراجعه کنید. در صورت داشتن هرگونه سوال، از طریق [تالار گفتمان4 ما را در جریان بگذارید.

نتیجه

در این پست وبلاگ، نحوه تبدیل اسناد Word به فایل های TXT در سی شارپ با استفاده از Aspose.Words برای دات نت را بررسی کرده ایم. نیازی به تجزیه کل اسناد Word نیست، به سادگی متن ساده را از یک سند در چند مرحله استخراج کنید. Aspose.Words فرآیند کار با اسناد Word را به صورت برنامه نویسی ساده می کند و راه حلی قابل اعتماد و کارآمد برای وظایف تبدیل سند ارائه می دهد. ادغام این کتابخانه در پروژه‌های C# شما را قادر می‌سازد تا پردازش اسناد را به راحتی انجام دهید و دنیایی از امکانات را برای برنامه‌های خود باز کنید.

همچنین ببینید