המר DOC DOCX ל-TXT ב-Python

כמתכנת, ייתכן שתצטרך לעבד חבורה של קבצי Word DOC/DOCX כדי לחלץ את הטקסט הפשוט מתוך יישומי Python שלך. מאמר זה מספק פתרון רב עוצמה, איכותי ופשוט לחילוץ טקסט רגיל מקובצי Word DOCX או DOC ב-Python. בסופו של דבר, תלמד כיצד להמיר קובץ DOCX או DOC ל-TXT ב-Python.

MS Word הוא יישום עיבוד תמלילים פופולרי המאפשר לך ליצור מסמכי טקסט עשיר. מגוון רחב של מסמכים נוצר ב-MS Word כולל חשבוניות, מסמכים טכניים, דוחות וכדומה. אז בואו נראה כיצד לבצע המרת Word ל-TXT ב-Python.

ממיר Python DOCX ל-TXT

עבור המרת Word ל-TXT, נשתמש ב-Aspose.Words for Python. זוהי ספרייה מדהימה עם מגוון רחב של תכונות לתמרן מסמכי טקסט פופולריים כולל DOC ו- DOCX. הספרייה מקלה על אופן העיבוד והשליפה של טקסט ממסמכי וורד. אתה יכול גם להשתמש בספרייה זו ולהמיר Word ל-TXT בחינם.

אתה יכול להשתמש בפקודה pip הבאה כדי להתקין את Aspose.Words עבור Python ביישום שלך.

pip install aspose-words

כיצד להמיר DOCX ל-TXT ב-Python

Aspose.Words עבור Python מפשט את ההמרה של DOCX ל-TXT שתוכל לבצע תוך מספר שלבים, כפי שצוין להלן:

  • טען את קובץ ה-DOCX מהדיסק.
  • שמור DOCX כפורמט TXT למיקום הרצוי.

אין צורך לנתח את כל מסמך Word עמוד אחר עמוד או שורה אחר שורה כדי לחלץ ממנו את הטקסט. כעת נראה כיצד לבצע את השלבים הללו ב- Python כדי להמיר קובץ DOCX לפורמט TXT.

שמור את Word DOC כ-TXT ב-Python

להלן השלבים לשמירת קובץ DOC או DOCX כ-TXT ב-Python.

  • טען את קובץ ה-DOC באמצעות Document class.
  • שמור DOC כ-TXT באמצעות שיטת Document.save(filePath) והעבר את נתיב הקובץ כפרמטר.

דוגמת הקוד הבאה מראה כיצד להמיר DOC ל-TXT ב-Python.

import aspose.words as aw

# טען קובץ DOC
doc = aw.Document("document.doc")

# שמור DOC כ-TXT
doc.save("doc-to-text.txt")

ממיר Python DOC ל-TXT בחינם

אתה יכול להשתמש ברישיון זמני בחינם כדי להמיר קבצי DOC לפורמט TXT ללא מגבלות הערכה.

חקור את ממיר Word ל-TXT

אתה יכול לבקר בתיעוד של ספריית Python Word כדי לחקור תכונות אחרות. אם יהיו לך שאלות כלשהן, אל תהסס ליידע אותנו דרך הפורום שלנו.

סיכום

במאמר זה, למדת כיצד להמיר קבצי DOC או DOCX לפורמט TXT ב-Python. בעזרת דגימת קוד, ראית כיצד לטעון ולשמור קבצי DOCX כ-TXT למיקום הרצוי ב-Python.

ראה גם