تحويل DOCX إلى TXT في Python

يتم استخدام تنسيقات MS Word DOC و DOCX بشكل شائع لإنشاء مستندات نصية منسقة. يمكنك إضافة نص وجداول ورسومات ورسوم متحركة وعناصر أخرى متنوعة إلى مستندات DOC / DOCX. ومع ذلك ، في حالات معينة ، على سبيل المثال لتحليل وتحليل النص في مستندات Word ، يجب عليك تحويل ملفات DOC / DOCX إلى تنسيق TXT برمجيًا. لتحقيق ذلك ، تتناول هذه المقالة كيفية تحويل ملف DOC أو DOCX إلى تنسيق TXT في Python.

Python DOC / DOCX إلى مكتبة محول TXT

لحفظ ملفات DOC و DOCX بتنسيق TXT ، سنستخدم Aspose.Words for Python. إنها مكتبة قوية وعالية السرعة توفر مجموعة من الميزات لإنشاء المستندات النصية ومعالجتها بسلاسة. بالإضافة إلى ذلك ، فإنه يوفر تحويلًا عالي الجودة للمستندات إلى تنسيقات أخرى. يمكنك تثبيت المكتبة في تطبيق Python الخاص بك من PyPI باستخدام أمر pip التالي.

> pip install aspose-words

تحويل DOCX إلى TXT في Python

دعونا نرى كيفية تحويل ملف DOCX إلى TXT في Python. لهذا ، ما عليك سوى تحميل ملف DOCX وحفظه كملف TXT. فيما يلي خطوات حفظ ملف DOCX بتنسيق TXT في Python.

  • قم بتحميل ملف DOCX باستخدام فئة المستند.
  • احفظ DOCX بتنسيق TXT باستخدام طريقة Document.save().

يوضح نموذج التعليمات البرمجية التالي كيفية إجراء تحويل DOCX إلى TXT في Python.

import aspose.words as aw

# قم بتحميل مستند DOC / DOCX
doc = aw.Document("Input.docx")

# حفظ باسم TXT
doc.save("Output.txt")

احصل على رخصة مجانية

يمكنك الحصول على ترخيص مؤقت مجاني لاستخدام Aspose.Words for Python بدون قيود تقييم.

استنتاج

في هذه المقالة ، تعلمت كيفية تحويل ملفات DOC أو DOCX إلى تنسيق TXT في Python. تتيح لك هذه الميزة استخراج النص من ملفات DOCX وحفظه في شكل ملف TXT عادي. وبالتالي ، يمكنك تحليل النص بسهولة أكبر. بالإضافة إلى ذلك ، يمكنك معرفة المزيد عن المكتبة باستخدام التوثيق. يمكنك أيضًا مشاركة أسئلتك أو استفساراتك عبر المنتدى.

أنظر أيضا