در موارد خاص، ممکن است نیاز داشته باشیم که داده ها را از یک فرمت به فرمت دیگر صادر کنیم. یکی از نیازهای رایج تبدیل اسناد Word (DOC یا DOCX) به فایلهای متن ساده (TXT) است. در این مقاله نحوه تبدیل Word به TXT با استفاده از کتابخانه Java Word to Text Converter را یاد می گیریم.
این مقاله موضوعات زیر را پوشش می دهد:
- مبدل Java کلمه به متن
- مراحل تبدیل DOCX به TXT
- تبدیل Word به TXT در جاوا
- تبدیل Word به TXT آنلاین
- منابع رایگان
کتابخانه تبدیل کلمه به متن Java
Aspose.Words for Java یک کتابخانه قدرتمند برای توسعه دهندگانی است که باید با اسناد در برنامه های Java خود کار کنند. این به توسعه دهندگان اجازه می دهد تا اسناد را به صورت برنامه نویسی در برنامه های Java ایجاد، ویرایش و تبدیل کنند. می توانید آن را به عنوان یک مجموعه ابزار برای کار با اسناد بدون نیاز به Microsoft Word در نظر بگیرید. ما از این کتابخانه برای تبدیل اسناد Word به فایل های متنی ساده استفاده خواهیم کرد. با استفاده از کتابخانه Aspose.Words for Java، میتوانیم بدون زحمت فایلهای DOC یا DOCX را به فرمت TXT تبدیل کنیم و به ما امکان میدهد متن را از یک سند Word استخراج کرده و آن را به عنوان یک فایل متنی ساده ذخیره کنیم.
لطفاً JAR API را دانلود کنید یا پیکربندی pom.xml زیر را در یک برنامه Java مبتنی بر Maven اضافه کنید.
<repositories>
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://releases.aspose.com/java/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>24.3</version>
<classifier>jdk17</classifier>
</dependency>
<dependencies>
مراحل تبدیل Word DOC به TXT
با دنبال کردن مراحل ساده زیر میتوانیم متن را از اسناد Word صادر کنیم و آن را در قالب TXT ذخیره کنیم:
- فایل Word DOC/DOCX را بارگیری کنید.
- آن را به فرمت TXT تبدیل کنید.
- فایل را در محل مورد نظر ذخیره کنید.
ما نیازی به پردازش دستی کل سند Word خط به خط یا صفحه به صفحه نداریم. ما می توانیم از کتابخانه های Java برای استخراج موثر محتوای متن استفاده کنیم. بیایید نحوه دستیابی به این امر در Java را بررسی کنیم.
تبدیل Word DOC به TXT در Java
با دنبال کردن مراحل زیر می توانیم به راحتی یک سند Word (DOC یا DOCX) را به یک فایل TXT در Java تبدیل کنیم:
- ابتدا Word DOC/DOCX را با استفاده از کلاس Document بارگذاری کنید.
- سپس، سند را به عنوان یک فایل TXT با استفاده از روش Document.save(filePath) ذخیره کنید.
نمونه کد زیر نحوه تبدیل یک سند Word به فرمت TXT در Java را نشان می دهد.
// این مثال کد نحوه ذخیره یک فایل DOCX را به عنوان TXT نشان می دهد
// فایل Word را بارگیری کنید
Document doc = new Document("D:\\Files\\document.docx");
// سند را به عنوان فایل TXT ذخیره کنید
doc.save("D:\\Files\\doc-to-text.txt");
مجوز رایگان دریافت کنید
برای تبدیل فایل های Word به فرمت TXT بدون محدودیت ارزیابی، می توانید یک مجوز موقت رایگان دریافت کنید.
تبدیل Word به TXT آنلاین
همچنین میتوانید از این مبدل کلمه به متن رایگان برای تبدیل DOCX به TXT به صورت آنلاین استفاده کنید. محتوای متنی خود را به سرعت و با کیفیت و دقت بالا از اسناد Word به قالب متنی ساده صادر کنید.
DOCX به TXT - منابع رایگان
علاوه بر تبدیل فایلهای DOC یا DOCX به فرمت TXT، پتانسیل کامل Aspose.Words for Java را باز کنید. با استفاده از منابع زیر، عملکردهای پیشرفته ای مانند ایجاد، ویرایش، مدیریت، یا تبدیل اسناد و موارد دیگر را کاوش کنید:
نتیجه
در این پست وبلاگ یاد گرفتیم که چگونه با استخراج محتوای متنی از یک سند Word و ذخیره آن به عنوان یک فایل متنی ساده، Word را به متن تبدیل کنیم. تبدیل Word به TXT در Java یک کار ساده است که با استفاده از کتابخانه Aspose.Words for Java قابل انجام است. بنابراین دفعه بعد که نیاز به تبدیل یک سند Word به متن ساده پیدا کردید، می توانید از نمونه کد ارائه شده در بالا به عنوان یک برنامه شروع استفاده کنید. در صورت وجود هرگونه ابهامی، لطفاً با ما در تالار گفتمان پشتیبانی رایگان تماس بگیرید.