Перетворення Word на JSON у Python

У різних випадках вам потрібно виконати програмне перетворення Word у JSON із програми Python. Наприклад, щоб експортувати дані з документа Word і обробити або транспортувати їх у форматі JSON. У цій статті ви дізнаєтеся, як легко конвертувати текст у документі Word у формат JSON. Крім того, ви дізнаєтесь, як завантажити захищений документ Word і програмно перетворити його на JSON. Тож давайте приступимо до перетворення Word у JSON на Python.

Як конвертувати Word у JSON на Python

Щоб конвертувати документ Word у формат JSON, ми виконаємо наступні кроки:

  • Завантажте документ Word.
  • Перетворіть його у формат HTML.
  • Збережіть файл HTML у форматі JSON.

Давайте подивимося, як програмно реалізувати ці кроки в Python. Для цього ми спочатку встановимо кілька бібліотек, як показано в наступному розділі.

Бібліотеки Python для перетворення Word у JSON — безкоштовне завантаження

Aspose.Words for Python — це потужна бібліотека, призначена для створення та обробки документів MS Word. Ми будемо використовувати цю бібліотеку для експорту вмісту документа Word у HTML. Отримавши вміст HTML, ми використаємо Aspose.Cells for Python, щоб зберегти його як файл JSON.

Ви можете використати наступні команди pip, щоб інсталювати обидві бібліотеки.

pip install aspose-cells
pip install aspose-words

Перетворення Word на JSON у Python

Нижче наведено кроки для перетворення Word на JSON у Python.

  • Завантажте документ Word за допомогою класу Document Aspose.Words.
  • Збережіть документ Word як HTML за допомогою методу Document.save().
  • Завантажте файл HTML за допомогою класу Workbook Aspose.Cells.
  • Перетворіть документ у формат JSON за допомогою методу Workbook.save().

У наведеному нижче прикладі коду показано, як перетворити документ Word на JSON у Python.

# Завантажити документ
doc = aw.Document("document1.docx")

# Зберегти документ у форматі HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Завантажте файл HTML в екземпляр класу Workbook
book = Workbook("html_output.html")

# Зберегти як JSON
book.save("word-to-json.json", SaveFormat.JSON)

Перетворення захищеного слова на JSON у Python

Ви також можете завантажити захищені документи Word, використовуючи їхні паролі, і конвертувати їх у формат JSON. Нижче наведено кроки для перетворення захищеного документа Word на JSON у Python.

  • Завантажте документ Word за допомогою класу Document Aspose.Words.
  • Використовуйте клас LoadOptions Aspose.Words, щоб вказати пароль захищеного документа Word.
  • Збережіть документ Word як HTML за допомогою методу Document.save().
  • Завантажте файл HTML за допомогою класу Workbook Aspose.Cells.
  • Перетворіть документ у формат JSON за допомогою методу Workbook.save().

У наведеному нижче прикладі коду показано, як перетворити захищений документ Word на JSON у Python.

# Завантажте захищений документ за допомогою LoadOptions
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# Зберегти документ у форматі HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Завантажте файл HTML в екземпляр класу Workbook
book = Workbook("html_output.html")

# Зберегти як JSON
book.save("word-to-json.json", SaveFormat.JSON)

Бібліотеки конвертера Python Word у JSON – отримайте безкоштовну ліцензію

Ви можете отримати безкоштовну тимчасову ліцензію на використання бібліотек без обмежень оцінки.

Висновок

У цій статті ви дізналися, як конвертувати Word у JSON на Python. Крім того, ви бачили, як програмно перетворити захищений паролем документ Word у JSON. Крім того, ви можете відвідати документацію Aspose.Words for Python і Aspose.Cells for Python, щоб дізнатися більше про бібліотеки. Якщо у вас виникнуть запитання, не соромтеся повідомити нас через наш форум.

Дивись також