Převeďte Word na JSON v Pythonu

V různých případech musíte provést převod Wordu na JSON programově z vaší aplikace Python. Chcete-li například exportovat data z dokumentu aplikace Word a zpracovat nebo přenést je ve formátu JSON. V tomto článku se dozvíte, jak snadno převést text v dokumentu aplikace Word do formátu JSON. Dále se dozvíte, jak načíst chráněný dokument Word a převést jej na JSON programově. Pojďme tedy převést Word na JSON v Pythonu.

Jak převést Word na JSON v Pythonu

Chcete-li převést dokument aplikace Word do formátu JSON, provedeme následující kroky:

  • Načtěte dokument aplikace Word.
  • Převeďte jej do formátu HTML.
  • Uložte soubor HTML ve formátu JSON.

Podívejme se, jak tyto kroky programově implementovat v Pythonu. Za tímto účelem nejprve nainstalujeme několik knihoven, jak je ukázáno v následující části.

Knihovny Pythonu pro převod Wordu do JSON – ke stažení zdarma

Aspose.Words for Python je výkonná knihovna, která je navržena pro vytváření a zpracování dokumentů MS Word. Tuto knihovnu použijeme k exportu obsahu dokumentu aplikace Word do HTML. Jakmile máme obsah HTML, použijeme Aspose.Cells for Python k jeho uložení jako souboru JSON.

K instalaci obou knihoven můžete použít následující příkazy pip.

pip install aspose-cells
pip install aspose-words

Převeďte Word na JSON v Pythonu

Níže jsou uvedeny kroky pro převod Wordu na JSON v Pythonu.

  • Načtěte dokument aplikace Word pomocí třídy Document třídy Aspose.Words.
  • Uložte dokument aplikace Word jako HTML pomocí metody Document.save().
  • Načtěte soubor HTML pomocí třídy Workbook Aspose.Cells.
  • Převeďte dokument do formátu JSON pomocí metody Workbook.save().

Následující ukázka kódu ukazuje, jak převést dokument aplikace Word na JSON v Pythonu.

# Načíst dokument
doc = aw.Document("document1.docx")

# Uložte dokument ve formátu HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Načtěte soubor HTML v instanci třídy Workbook
book = Workbook("html_output.html")

# Uložit jako JSON
book.save("word-to-json.json", SaveFormat.JSON)

Převeďte chráněné slovo na JSON v Pythonu

Můžete také načíst chráněné dokumenty aplikace Word pomocí jejich hesel a převést je do formátu JSON. Následují kroky k převodu chráněného dokumentu aplikace Word na JSON v Pythonu.

  • Načtěte dokument aplikace Word pomocí třídy Document třídy Aspose.Words.
  • Pomocí třídy LoadOptions třídy Aspose.Words zadejte heslo chráněného dokumentu aplikace Word.
  • Uložte dokument aplikace Word jako HTML pomocí metody Document.save().
  • Načtěte soubor HTML pomocí třídy Workbook Aspose.Cells.
  • Převeďte dokument do formátu JSON pomocí metody Workbook.save().

Následující ukázka kódu ukazuje, jak převést chráněný dokument aplikace Word na JSON v Pythonu.

# Načtěte chráněný dokument pomocí LoadOptions
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# Uložte dokument ve formátu HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Načtěte soubor HTML v instanci třídy Workbook
book = Workbook("html_output.html")

# Uložit jako JSON
book.save("word-to-json.json", SaveFormat.JSON)

Knihovny Python Word to JSON Converter – získejte bezplatnou licenci

Můžete získat bezplatnou dočasnou licenci k používání knihoven bez omezení hodnocení.

Závěr

V tomto článku jste se naučili, jak převést Word na JSON v Pythonu. Navíc jste viděli, jak programově převést dokument Word chráněný heslem na JSON. Kromě toho můžete navštívit dokumentaci Aspose.Words pro Python a Aspose.Cells pro Python a prozkoumat více o knihovnách. V případě jakýchkoli dotazů nás neváhejte kontaktovat prostřednictvím našeho fóra.

Viz také