Word to HTML Python

Převod z Wordu na HTML je vyžadován v různých případech, například pro vkládání obsahu dokumentu na webové stránky. V tomto článku se dozvíte, jak převést dokumenty MS Word DOCX nebo DOC do HTML pomocí Python. Navíc se naučíte, jak dynamicky ovládat převod Wordu do HTML pomocí různých možností.

Python Word to HTML Converter API

Abychom převedli dokumenty Wordu do HTML, použijeme Aspose.Words for Python. Jedná se o výkonné a na funkce bohaté API pro vytváření a manipulaci s dokumenty aplikace Word. Poskytuje také vysoce věrný převod dokumentů aplikace Word do jiných formátů. Aspose.Words for Python je k dispozici na PyPI a můžete jej nainstalovat pomocí následujícího příkazu pip.

pip install aspose-words 

Převeďte dokument aplikace Word na HTML v Python

Níže jsou uvedeny kroky pro převod dokumentu aplikace Word na soubor HTML pomocí Python.

  • Načtěte dokument aplikace Word pomocí třídy Document.
  • Vytvořte objekt třídy HtmlSaveOptions.
  • Povolte export zdrojů písem pomocí vlastnosti HtmlSaveOptions.exportfontresources.
  • Převeďte dokument aplikace Word na HTML pomocí metody Document.save().

Následující ukázka kódu ukazuje, jak převést soubor DOCX na HTML v Python.

import aspose.words as aw

# Načtěte dokument z disku
doc = aw.Document("Document.docx")

# Povolit export písem
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
  
# Uložte dokument jako HTML
doc.save("Document.html", options)

Přizpůsobte převod Wordu do HTML v Python

Aspose.Words for Python také poskytuje různé možnosti přizpůsobení převodu Word do HTML. Můžete například převádět dokumenty s informacemi o zpáteční cestě, určit složku pro uložení souborů prostředků a tak dále.

Převeďte dokument aplikace Word s informacemi o zpáteční cestě

HTML nepodporuje všechny funkce poskytované MS Word, a proto, abychom mohli napodobit dokument Wordu v HTML, musíme uložit další informace nazývané jako informace o zpáteční cestě. Následují kroky k zapnutí exportu zpátečních informací v převodu Word do HTML.

  • Načtěte dokument aplikace Word pomocí třídy Document.
  • Vytvořte objekt třídy HtmlSaveOptions a nastavte vlastnost HtmlSaveOptions.exportroundtripinformation na hodnotu true.
  • Převeďte dokument Wordu do HTML pomocí metody Document.save() a jako parametry předejte název souboru HTML a HtmlSaveOptions.

Následující ukázka kódu ukazuje, jak exportovat zpáteční informace v převodu Word do HTML.

import aspose.words as aw

# Načtěte dokument z disku
doc = aw.Document("Document.docx")

# Povolit informace o zpáteční cestě
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True 

# Uložte dokument jako HTML
doc.save("Document.html", saveOptions)

Word to HTML: Určete složku pro zdroje

Můžete také určit složku, kam chcete uložit všechny prostředky, jako jsou obrázky, soubory CSS a písma. K tomu můžete použít vlastnost HtmlSaveOptions.exportfontresources. Můžete také určit samostatné složky pro písma a obrázky pomocí vlastností HtmlSaveOptions.fontsfolder a HtmlSaveOptions.imagesfolder. Následují kroky k použití samostatné složky k uložení prostředků v převodu Word na HTML.

  • Načtěte dokument aplikace Word pomocí třídy Document.
  • Vytvořte objekt třídy HtmlSaveOptions a nastavte vlastnost HtmlSaveOptions.exportfontresources na true.
  • Zadejte název složky prostředků pomocí vlastnosti HtmlSaveOptions.resourcefolder.
  • Převeďte dokument Wordu do HTML pomocí metody Document.save() a jako parametry předejte název souboru HTML a HtmlSaveOptions.

Následující ukázka kódu ukazuje, jak zadat složku prostředků v převodu Word na HTML.

import aspose.words as aw

# Načtěte dokument z disku
doc = aw.Document("Document.docx")

# Zadejte složku prostředků
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"

# Uložte dokument jako HTML
doc.save("Document.html", saveOptions)

Získejte bezplatnou licenci API

Můžete získat dočasnou licenci, abyste mohli používat Aspose.Words for Python bez omezení hodnocení.

Závěr

V tomto článku jste se naučili, jak převést dokumenty Wordu do HTML pomocí Python. Navíc jste viděli, jak dynamicky přizpůsobit převod Wordu do HTML. Kromě toho můžete prozkoumat další funkce Aspose.Words for Python pomocí dokumentace. Své dotazy můžete pokládat také prostřednictvím našeho fóra.

Viz také

Informace: Možná vás bude zajímat další Python API (Apose.Slides for Python via NET), které umožňuje převádět prezentace na obrázky a importovat obrázky do prezentací.