V různých případech musíte provést převod Wordu na JSON programově z vaší aplikace Python. Chcete-li například exportovat data z dokumentu aplikace Word a zpracovat nebo přenést je ve formátu JSON. V tomto článku se dozvíte, jak snadno převést text v dokumentu aplikace Word do formátu JSON. Dále se dozvíte, jak načíst chráněný dokument Word a převést jej na JSON programově. Pojďme tedy převést Word na JSON v Pythonu.
- Kroky k převodu Wordu na JSON v Pythonu
- Knihovna Python pro převod Wordu do JSON – ke stažení zdarma
- Převeďte Word na JSON v Pythonu
- Převeďte chráněné slovo na JSON v Pythonu
Jak převést Word na JSON v Pythonu
Chcete-li převést dokument aplikace Word do formátu JSON, provedeme následující kroky:
- Načtěte dokument aplikace Word.
- Převeďte jej do formátu HTML.
- Uložte soubor HTML ve formátu JSON.
Podívejme se, jak tyto kroky programově implementovat v Pythonu. Za tímto účelem nejprve nainstalujeme několik knihoven, jak je ukázáno v následující části.
Knihovny Pythonu pro převod Wordu do JSON – ke stažení zdarma
Aspose.Words for Python je výkonná knihovna, která je navržena pro vytváření a zpracování dokumentů MS Word. Tuto knihovnu použijeme k exportu obsahu dokumentu aplikace Word do HTML. Jakmile máme obsah HTML, použijeme Aspose.Cells for Python k jeho uložení jako souboru JSON.
K instalaci obou knihoven můžete použít následující příkazy pip.
pip install aspose-cells
pip install aspose-words
Převeďte Word na JSON v Pythonu
Níže jsou uvedeny kroky pro převod Wordu na JSON v Pythonu.
- Načtěte dokument aplikace Word pomocí třídy Document třídy Aspose.Words.
- Uložte dokument aplikace Word jako HTML pomocí metody Document.save().
- Načtěte soubor HTML pomocí třídy Workbook Aspose.Cells.
- Převeďte dokument do formátu JSON pomocí metody Workbook.save().
Následující ukázka kódu ukazuje, jak převést dokument aplikace Word na JSON v Pythonu.
# Načíst dokument
doc = aw.Document("document1.docx")
# Uložte dokument ve formátu HTML
doc.save("html_output.html", aw.SaveFormat.HTML)
# Načtěte soubor HTML v instanci třídy Workbook
book = Workbook("html_output.html")
# Uložit jako JSON
book.save("word-to-json.json", SaveFormat.JSON)
Převeďte chráněné slovo na JSON v Pythonu
Můžete také načíst chráněné dokumenty aplikace Word pomocí jejich hesel a převést je do formátu JSON. Následují kroky k převodu chráněného dokumentu aplikace Word na JSON v Pythonu.
- Načtěte dokument aplikace Word pomocí třídy Document třídy Aspose.Words.
- Pomocí třídy LoadOptions třídy Aspose.Words zadejte heslo chráněného dokumentu aplikace Word.
- Uložte dokument aplikace Word jako HTML pomocí metody Document.save().
- Načtěte soubor HTML pomocí třídy Workbook Aspose.Cells.
- Převeďte dokument do formátu JSON pomocí metody Workbook.save().
Následující ukázka kódu ukazuje, jak převést chráněný dokument aplikace Word na JSON v Pythonu.
# Načtěte chráněný dokument pomocí LoadOptions
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))
# Uložte dokument ve formátu HTML
doc.save("html_output.html", aw.SaveFormat.HTML)
# Načtěte soubor HTML v instanci třídy Workbook
book = Workbook("html_output.html")
# Uložit jako JSON
book.save("word-to-json.json", SaveFormat.JSON)
Knihovny Python Word to JSON Converter – získejte bezplatnou licenci
Můžete získat bezplatnou dočasnou licenci k používání knihoven bez omezení hodnocení.
Závěr
V tomto článku jste se naučili, jak převést Word na JSON v Pythonu. Navíc jste viděli, jak programově převést dokument Word chráněný heslem na JSON. Kromě toho můžete navštívit dokumentaci Aspose.Words pro Python a Aspose.Cells pro Python a prozkoumat více o knihovnách. V případě jakýchkoli dotazů nás neváhejte kontaktovat prostřednictvím našeho fóra.