تبدیل DOCX به TXT در پایتون

فرمت‌های MS Word DOC و DOCX معمولاً برای ایجاد اسناد متنی غنی استفاده می‌شوند. می توانید متن، جداول، گرافیک، انیمیشن ها و عناصر مختلف دیگر را به اسناد DOC/DOCX اضافه کنید. با این حال، در موارد خاص، به عنوان مثال برای تجزیه و تحلیل متن در اسناد Word، باید فایل‌های DOC/DOCX را به صورت برنامه‌نویسی به فرمت TXT تبدیل کنید. برای دستیابی به آن، این مقاله نحوه تبدیل یک فایل DOC یا DOCX به فرمت TXT در پایتون را پوشش می‌دهد.

کتابخانه مبدل پایتون DOC/DOCX به TXT

برای ذخیره فایل‌های DOC و DOCX در قالب TXT، از Aspose.Words برای Python استفاده می‌کنیم. این یک کتابخانه قدرتمند و پرسرعت است که مجموعه ای از ویژگی ها را برای ایجاد و دستکاری اسناد متنی یکپارچه ارائه می دهد. علاوه بر این، تبدیل اسناد با کیفیت بالا به فرمت های دیگر را ارائه می دهد. می توانید کتابخانه را در برنامه پایتون خود از PyPI با استفاده از دستور pip زیر نصب کنید.

> pip install aspose-words

تبدیل DOCX به TXT در پایتون

بیایید ببینیم چگونه یک فایل DOCX را در پایتون به TXT تبدیل کنیم. برای این کار، فقط باید فایل DOCX را بارگیری کنید و آن را به عنوان یک فایل TXT ذخیره کنید. در زیر مراحل ذخیره فایل DOCX با فرمت TXT در پایتون آمده است.

  • فایل DOCX را با استفاده از کلاس Document بارگیری کنید.
  • با استفاده از روش ()Document.save DOCX را به عنوان TXT ذخیره کنید.

نمونه کد زیر نحوه انجام تبدیل DOCX به TXT در پایتون را نشان می دهد.

import aspose.words as aw

# سند DOC/DOCX را بارگیری کنید
doc = aw.Document("Input.docx")

# ذخیره به عنوان TXT
doc.save("Output.txt")

مجوز رایگان دریافت کنید

برای استفاده از Aspose.Words برای Python بدون محدودیت ارزیابی، می توانید یک مجوز موقت رایگان دریافت کنید.

نتیجه

در این مقاله با نحوه تبدیل فایل های DOC یا DOCX به فرمت TXT در پایتون آشنا شدید. این قابلیت به شما امکان می دهد متن را از فایل های DOCX استخراج کرده و در قالب یک فایل TXT ساده ذخیره کنید. بنابراین، می توانید متن را راحت تر تجزیه و تحلیل کنید. علاوه بر این، می‌توانید با استفاده از مستندات درباره کتابخانه اطلاعات بیشتری کسب کنید. همچنین، می‌توانید سؤالات یا سؤالات خود را از طریق [فروم 7 ما به اشتراک بگذارید.

همچنین ببینید