
فرمتهای MS Word DOC و DOCX معمولاً برای ایجاد اسناد متنی غنی استفاده میشوند. می توانید متن، جداول، گرافیک، انیمیشن ها و عناصر مختلف دیگر را به اسناد DOC/DOCX اضافه کنید. با این حال، در موارد خاص، به عنوان مثال برای تجزیه و تحلیل متن در اسناد Word، باید فایلهای DOC/DOCX را به صورت برنامهنویسی به فرمت TXT تبدیل کنید. برای دستیابی به آن، این مقاله نحوه تبدیل یک فایل DOC یا DOCX به فرمت TXT در پایتون را پوشش میدهد.
کتابخانه مبدل پایتون DOC/DOCX به TXT
برای ذخیره فایلهای DOC و DOCX در قالب TXT، از Aspose.Words برای Python استفاده میکنیم. این یک کتابخانه قدرتمند و پرسرعت است که مجموعه ای از ویژگی ها را برای ایجاد و دستکاری اسناد متنی یکپارچه ارائه می دهد. علاوه بر این، تبدیل اسناد با کیفیت بالا به فرمت های دیگر را ارائه می دهد. می توانید کتابخانه را در برنامه پایتون خود از PyPI با استفاده از دستور pip زیر نصب کنید.
> pip install aspose-words
تبدیل DOCX به TXT در پایتون
بیایید ببینیم چگونه یک فایل DOCX را در پایتون به TXT تبدیل کنیم. برای این کار، فقط باید فایل DOCX را بارگیری کنید و آن را به عنوان یک فایل TXT ذخیره کنید. در زیر مراحل ذخیره فایل DOCX با فرمت TXT در پایتون آمده است.
- فایل DOCX را با استفاده از کلاس Document بارگیری کنید.
- با استفاده از روش ()Document.save DOCX را به عنوان TXT ذخیره کنید.
نمونه کد زیر نحوه انجام تبدیل DOCX به TXT در پایتون را نشان می دهد.
import aspose.words as aw
# سند DOC/DOCX را بارگیری کنید
doc = aw.Document("Input.docx")
# ذخیره به عنوان TXT
doc.save("Output.txt")
مجوز رایگان دریافت کنید
برای استفاده از Aspose.Words برای Python بدون محدودیت ارزیابی، می توانید یک مجوز موقت رایگان دریافت کنید.
نتیجه
در این مقاله با نحوه تبدیل فایل های DOC یا DOCX به فرمت TXT در پایتون آشنا شدید. این قابلیت به شما امکان می دهد متن را از فایل های DOCX استخراج کرده و در قالب یک فایل TXT ساده ذخیره کنید. بنابراین، می توانید متن را راحت تر تجزیه و تحلیل کنید. علاوه بر این، میتوانید با استفاده از مستندات درباره کتابخانه اطلاعات بیشتری کسب کنید. همچنین، میتوانید سؤالات یا سؤالات خود را از طریق [فروم 7 ما به اشتراک بگذارید.