המר Word ל-JSON ב-Python

במקרים שונים, עליך לבצע המרת Word ל-JSON באופן תוכניתי מתוך אפליקציית Python שלך. לדוגמה, לייצא את הנתונים ממסמך Word ולעבד או להעביר אותם בפורמט JSON. במאמר זה תלמד כיצד להמיר בקלות את הטקסט במסמך Word לפורמט JSON. יתר על כן, תלמד כיצד לטעון מסמך Word מוגן ולהמיר אותו ל-JSON באופן תוכנתי. אז בואו נמשיך להמיר Word ל-JSON ב-Python.

כיצד להמיר Word ל-JSON ב-Python

כדי להמיר מסמך Word לפורמט JSON, נבצע את השלבים הבאים:

  • טען את מסמך ה-Word.
  • המר אותו לפורמט HTML.
  • שמור קובץ HTML בפורמט JSON.

בוא נראה כיצד ליישם את השלבים הללו באופן פרוגרמטי ב-Python. לשם כך, נתקין תחילה כמה ספריות, כפי שמודגם בסעיף הבא.

ספריות פייתון להמרת Word ל-JSON - הורדה חינם

Aspose.Words for Python היא ספרייה רבת עוצמה שנועדה ליצור ולעבד מסמכי MS Word. אנו נשתמש בספרייה זו כדי לייצא את התוכן של מסמך Word ל-HTML. ברגע שיש לנו את תוכן ה-HTML, נשתמש ב-Aspose.Cells for Python כדי לשמור אותו כקובץ JSON.

אתה יכול להשתמש בפקודות ה-pip הבאות כדי להתקין את שתי הספריות.

pip install aspose-cells
pip install aspose-words

המר את Word ל-JSON ב-Python

להלן השלבים להמרת Word ל-JSON ב-Python.

  • טען את מסמך Word באמצעות מחלקה Document של Aspose.Words.
  • שמור מסמך Word כ-HTML באמצעות שיטת Document.save().
  • טען קובץ HTML באמצעות מחלקה Workbook של Aspose.Cells.
  • המר מסמך לפורמט JSON באמצעות שיטת Workbook.save().

דוגמת הקוד הבאה מראה כיצד להמיר מסמך Word ל-JSON ב-Python.

# טען מסמך
doc = aw.Document("document1.docx")

# שמור מסמך בפורמט HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# טען את קובץ ה-HTML במופע של מחלקה Workbook
book = Workbook("html_output.html")

# שמור כ-JSON
book.save("word-to-json.json", SaveFormat.JSON)

המר מוגן Word ל-JSON ב-Python

אתה יכול גם לטעון את מסמכי Word המוגנים באמצעות הסיסמאות שלהם ולהמיר אותם לפורמט JSON. להלן השלבים להמרת מסמך Word מוגן ל-JSON ב-Python.

  • טען את מסמך Word באמצעות מחלקה Document של Aspose.Words.
  • השתמש במחלקת LoadOptions של Aspose.Words כדי לציין את הסיסמה של מסמך Word מוגן.
  • שמור מסמך Word כ-HTML באמצעות שיטת Document.save().
  • טען קובץ HTML באמצעות מחלקה Workbook של Aspose.Cells.
  • המר מסמך לפורמט JSON באמצעות שיטת Workbook.save().

דוגמת הקוד הבאה מראה כיצד להמיר מסמך Word מוגן ל-JSON ב-Python.

# טען מסמך מוגן באמצעות LoadOptions
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# שמור מסמך בפורמט HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# טען את קובץ ה-HTML במופע של מחלקה Workbook
book = Workbook("html_output.html")

# שמור כ-JSON
book.save("word-to-json.json", SaveFormat.JSON)

ספריות ממיר Python Word ל-JSON - קבל רישיון חינם

אתה יכול לקבל [רישיון זמני] בחינם6 לשימוש בספריות ללא מגבלות הערכה.

סיכום

במאמר זה, למדת כיצד להמיר Word ל-JSON ב-Python. יתר על כן, ראית כיצד להמיר מסמך Word מוגן בסיסמה ל-JSON באופן תוכנתי. חוץ מזה, אתה יכול לבקר בתיעוד של Aspose.Words for Python ו-Aspose.Cells for Python כדי לחקור יותר על הספריות. למקרה שיש לך שאלות כלשהן, אל תהסס ליידע אותנו דרך הפורום שלנו.

ראה גם