تبدیل Word به JSON در پایتون

در موارد مختلف، شما باید تبدیل Word به JSON را به صورت برنامه‌نویسی از داخل برنامه پایتون خود انجام دهید. به عنوان مثال، برای صادر کردن داده ها از یک سند Word و پردازش یا انتقال آن در قالب JSON. در این مقاله یاد می گیرید که چگونه متن یک سند Word را به راحتی به فرمت JSON تبدیل کنید. علاوه بر این، یاد خواهید گرفت که چگونه یک سند Word محافظت شده را بارگیری کرده و آن را به صورت برنامه‌نویسی به JSON تبدیل کنید. پس بیایید به تبدیل Word به JSON در پایتون ادامه دهیم.

نحوه تبدیل Word به JSON در پایتون

برای تبدیل یک سند Word به فرمت JSON، مراحل زیر را انجام می دهیم:

  • سند Word را بارگیری کنید.
  • آن را به فرمت HTML تبدیل کنید.
  • فایل HTML را با فرمت JSON ذخیره کنید.

بیایید ببینیم که چگونه این مراحل را به صورت برنامه نویسی در پایتون پیاده سازی کنیم. برای این کار، همانطور که در بخش زیر نشان داده شده است، ابتدا چند کتابخانه را نصب می کنیم.

کتابخانه های پایتون برای تبدیل Word به JSON - دانلود رایگان

Aspose.Words for Python یک کتابخانه قدرتمند است که برای ایجاد و پردازش اسناد MS Word طراحی شده است. ما از این کتابخانه برای صادر کردن محتوای یک سند Word به HTML استفاده خواهیم کرد. هنگامی که محتوای HTML را داشتیم، از Aspose.Cells برای پایتون برای ذخیره آن به عنوان یک فایل JSON استفاده می کنیم.

برای نصب هر دو کتابخانه می توانید از دستورات پیپ زیر استفاده کنید.

pip install aspose-cells
pip install aspose-words

تبدیل Word به JSON در پایتون

در زیر مراحل تبدیل Word به JSON در پایتون آمده است.

  • سند Word را با استفاده از کلاس Document Aspose.Words بارگیری کنید.
  • با استفاده از متد ()Document.save سند Word را به صورت HTML ذخیره کنید.
  • فایل HTML را با استفاده از کلاس Workbook Aspose.Cells بارگیری کنید.
  • با استفاده از متد Workbook.save() سند را به فرمت JSON تبدیل کنید.

نمونه کد زیر نحوه تبدیل یک سند Word به JSON در پایتون را نشان می دهد.

# بارگذاری سند
doc = aw.Document("document1.docx")

# سند را در قالب HTML ذخیره کنید
doc.save("html_output.html", aw.SaveFormat.HTML)

# فایل HTML را در یک نمونه از کلاس Workbook بارگیری کنید
book = Workbook("html_output.html")

# ذخیره به عنوان JSON
book.save("word-to-json.json", SaveFormat.JSON)

تبدیل کلمه محافظت شده به JSON در پایتون

همچنین می توانید اسناد Word محافظت شده را با استفاده از رمزهای عبور بارگیری کرده و آنها را به فرمت JSON تبدیل کنید. در زیر مراحل تبدیل یک سند Word محافظت شده به JSON در پایتون آمده است.

  • سند Word را با استفاده از کلاس Document Aspose.Words بارگیری کنید.
  • از کلاس LoadOptions Aspose.Words برای تعیین رمز عبور سند محافظت شده Word استفاده کنید.
  • با استفاده از متد ()Document.save سند Word را به صورت HTML ذخیره کنید.
  • فایل HTML را با استفاده از کلاس Workbook Aspose.Cells بارگیری کنید.
  • با استفاده از متد Workbook.save() سند را به فرمت JSON تبدیل کنید.

نمونه کد زیر نحوه تبدیل یک سند Word محافظت شده به JSON در پایتون را نشان می دهد.

# سند محافظت شده را با استفاده از LoadOptions بارگیری کنید
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# سند را در قالب HTML ذخیره کنید
doc.save("html_output.html", aw.SaveFormat.HTML)

# فایل HTML را در یک نمونه از کلاس Workbook بارگیری کنید
book = Workbook("html_output.html")

# ذخیره به عنوان JSON
book.save("word-to-json.json", SaveFormat.JSON)

کتابخانه های مبدل Python Word به JSON - مجوز رایگان دریافت کنید

می توانید برای استفاده از کتابخانه ها بدون محدودیت ارزیابی، مجوز موقت رایگان دریافت کنید.

نتیجه

در این مقاله با نحوه تبدیل Word به JSON در پایتون آشنا شدید. علاوه بر این، نحوه تبدیل یک سند Word محافظت شده با رمز عبور را به صورت برنامه‌نویسی به JSON مشاهده کرده‌اید. علاوه بر این، می‌توانید از اسناد Aspose.Words for Python و Aspose.Cells for Python دیدن کنید تا اطلاعات بیشتری در مورد کتابخانه‌ها کشف کنید. در صورت داشتن هرگونه سوال، از طریق [تالار گفتمان8 ما را در جریان بگذارید.

همچنین ببینید