แปลง Word เป็น JSON ใน Python

ในหลายกรณี คุณต้องดำเนินการแปลง Word เป็น JSON โดยทางโปรแกรมจากภายในแอปพลิเคชัน Python ของคุณ ตัวอย่างเช่น เพื่อส่งออกข้อมูลจากเอกสาร Word และประมวลผลหรือส่งในรูปแบบ JSON ในบทความนี้ คุณจะได้เรียนรู้วิธีแปลงข้อความในเอกสาร Word เป็นรูปแบบ JSON อย่างง่ายดาย นอกจากนี้ คุณจะได้เรียนรู้วิธีโหลดเอกสาร Word ที่ได้รับการป้องกันและแปลงเป็น JSON โดยทางโปรแกรม ดังนั้นมาดำเนินการแปลง Word เป็น JSON ใน Python

วิธีแปลง Word เป็น JSON ใน Python

ในการแปลงเอกสาร Word เป็นรูปแบบ JSON เราจะดำเนินการตามขั้นตอนต่อไปนี้:

  • โหลดเอกสาร Word
  • แปลงเป็นรูปแบบ HTML
  • บันทึกไฟล์ HTML ในรูปแบบ JSON

มาดูวิธีการใช้ขั้นตอนเหล่านี้โดยทางโปรแกรมใน Python สำหรับสิ่งนี้ อันดับแรกเราจะติดตั้งไลบรารีสองสามตัวดังที่แสดงไว้ในส่วนต่อไปนี้

Python Libraries เพื่อแปลง Word เป็น JSON - ดาวน์โหลดฟรี

Aspose.Words for Python เป็นไลบรารีที่มีประสิทธิภาพซึ่งออกแบบมาเพื่อสร้างและประมวลผลเอกสาร MS Word เราจะใช้ไลบรารีนี้เพื่อส่งออกเนื้อหาของเอกสาร Word เป็น HTML เมื่อเรามีเนื้อหา HTML แล้ว เราจะใช้ Aspose.Cells for Python เพื่อบันทึกเป็นไฟล์ JSON

คุณสามารถใช้คำสั่ง pip ต่อไปนี้เพื่อติดตั้งทั้งสองไลบรารี

pip install aspose-cells
pip install aspose-words

แปลง Word เป็น JSON ใน Python

ต่อไปนี้เป็นขั้นตอนในการแปลง Word เป็น JSON ใน Python

  • โหลดเอกสาร Word โดยใช้คลาส Document ของ Aspose.Words
  • บันทึกเอกสาร Word เป็น HTML โดยใช้วิธี Document.save()
  • โหลดไฟล์ HTML โดยใช้คลาสสมุดงานของ Aspose.Cells
  • แปลงเอกสารเป็นรูปแบบ JSON โดยใช้วิธี Workbook.save()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแปลงเอกสาร Word เป็น JSON ใน Python

# โหลดเอกสาร
doc = aw.Document("document1.docx")

# บันทึกเอกสารในรูปแบบ HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# โหลดไฟล์ HTML ในอินสแตนซ์ของคลาสสมุดงาน
book = Workbook("html_output.html")

# บันทึกเป็น JSON
book.save("word-to-json.json", SaveFormat.JSON)

แปลง Protected Word เป็น JSON ใน Python

คุณยังสามารถโหลดเอกสาร Word ที่มีการป้องกันโดยใช้รหัสผ่านและแปลงเป็นรูปแบบ JSON ต่อไปนี้เป็นขั้นตอนในการแปลงเอกสาร Word ที่มีการป้องกันเป็น JSON ใน Python

  • โหลดเอกสาร Word โดยใช้คลาส Document ของ Aspose.Words
  • ใช้คลาส LoadOptions ของ Aspose.Words เพื่อระบุรหัสผ่านของเอกสาร Word ที่ได้รับการป้องกัน
  • บันทึกเอกสาร Word เป็น HTML โดยใช้วิธี Document.save()
  • โหลดไฟล์ HTML โดยใช้คลาสสมุดงานของ Aspose.Cells
  • แปลงเอกสารเป็นรูปแบบ JSON โดยใช้วิธี Workbook.save()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแปลงเอกสาร Word ที่มีการป้องกันเป็น JSON ใน Python

# โหลดเอกสารที่มีการป้องกันโดยใช้ LoadOptions
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# บันทึกเอกสารในรูปแบบ HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# โหลดไฟล์ HTML ในอินสแตนซ์ของคลาสสมุดงาน
book = Workbook("html_output.html")

# บันทึกเป็น JSON
book.save("word-to-json.json", SaveFormat.JSON)

ไลบรารีตัวแปลง Python Word เป็น JSON - รับใบอนุญาตฟรี

คุณสามารถรับ ใบอนุญาตชั่วคราวฟรี เพื่อใช้ห้องสมุดโดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแปลง Word เป็น JSON ใน Python นอกจากนี้ คุณได้เห็นวิธีแปลงเอกสาร Word ที่ป้องกันด้วยรหัสผ่านเป็น JSON โดยทางโปรแกรม นอกจากนี้ คุณสามารถเยี่ยมชมเอกสารประกอบของ Aspose.Words for Python และ Aspose.Cells for Python เพื่อสำรวจเพิ่มเติมเกี่ยวกับไลบรารี ในกรณีที่คุณมีคำถามใดๆ โปรดแจ้งให้เราทราบผ่านทาง ฟอรัม ของเรา

ดูสิ่งนี้ด้วย