Word till HTML Python

Word till HTML-konvertering krävs i olika fall, till exempel för att bädda in dokumentets innehåll på webbsidorna. I den här artikeln kommer du att lära dig hur du konverterar MS Word DOCX- eller DOC-dokument till HTML med Python. Dessutom kommer du att lära dig hur du styr konverteringen av Word till HTML dynamiskt med hjälp av olika alternativ.

Python-bibliotek för att konvertera Word till HTML

För att konvertera Word-dokument till HTML kommer vi att använda Aspose.Words for Python. Det är ett kraftfullt och funktionsrikt API för att skapa och manipulera Word-dokument. Det ger också en högfientlig konvertering av Word-dokument till andra format. Aspose.Words för Python är tillgängligt på PyPI och du kan installera det med följande pip-kommando.

pip install aspose-words 

Konvertera ett Word DOC till HTML i Python

Följande är stegen för att konvertera ett Word-dokument till en HTML-fil med Python.

  • Ladda Word-dokumentet med dokumentklassen.
  • Skapa ett objekt av klassen HtmlSaveOptions.
  • Aktivera export av teckensnittsresurser med egenskapen HtmlSaveOptions.exportfontresources.
  • Konvertera Word-dokument till HTML med metoden Document.save().

Följande kodexempel visar hur man konverterar en DOCX-fil till HTML i Python.

import aspose.words as aw

# Ladda dokumentet från disken
doc = aw.Document("Document.docx")

# Aktivera export av teckensnitt
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
  
# Spara dokumentet som HTML
doc.save("Document.html", options)

Anpassa Word till HTML-konvertering i Python

Aspose.Words för Python erbjuder också olika alternativ för att anpassa Word till HTML-konverteringen. Du kan till exempel konvertera dokument med information om tur och retur, ange mappen för att spara resursfilerna och så vidare.

Konvertera DOC till HTML med information om tur och retur

HTML stöder inte alla funktioner som tillhandahålls av MS Word, därför, för att efterlikna Word-dokumentet i HTML, måste vi spara ytterligare information som kallas tur- och returinformation. Följande är stegen för att aktivera export av information om tur och retur i Word till HTML-konvertering.

  • Ladda Word-dokumentet med dokumentklassen.
  • Skapa ett objekt av klassen HtmlSaveOptions och ställ in egenskapen HtmlSaveOptions.exportroundtripinformation till true.
  • Konvertera Word-dokument till HTML med metoden Document.save() och skicka HTML-filens namn och HtmlSaveOptions som parametrar.

Följande kodexempel visar hur man exporterar information om tur och retur i Word till HTML-konvertering.

import aspose.words as aw

# Ladda dokumentet från disken
doc = aw.Document("Document.docx")

# Aktivera information om tur och retur
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True 

# Spara dokumentet som HTML
doc.save("Document.html", saveOptions)

Ange resursmapp i DOC till HTML-konvertering

Du kan också ange en mapp där du vill lagra alla resurser som bilder, CSS-filer och typsnitt. För detta kan du använda egenskapen HtmlSaveOptions.exportfontresources. Du kan också ange separata mappar för teckensnitt och bilder med hjälp av egenskaperna HtmlSaveOptions.fontsfolder och HtmlSaveOptions.imagesfolder. Följande är stegen för att använda en separat mapp för att spara resurser i Word till HTML-konvertering.

  • Ladda Word-dokumentet med dokumentklassen.
  • Skapa ett objekt av klassen HtmlSaveOptions och ställ in egenskapen HtmlSaveOptions.exportfontresources till true.
  • Ange namnet på resursmappen med egenskapen HtmlSaveOptions.resourcefolder.
  • Konvertera Word-dokument till HTML med metoden Document.save() och skicka HTML-filens namn och HtmlSaveOptions som parametrar.

Följande kodexempel visar hur man anger en resursmapp i Word till HTML-konvertering.

import aspose.words as aw

# Ladda dokumentet från disken
doc = aw.Document("Document.docx")

# Ange resursmapp
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"

# Spara dokumentet som HTML
doc.save("Document.html", saveOptions)

Skaffa en gratis API-licens

Du kan skaffa en tillfällig licens för att använda Aspose.Words för Python utan utvärderingsbegränsningar.

Slutsats

I den här artikeln har du lärt dig hur du konverterar Word-dokument till HTML med Python. Dessutom har du sett hur du anpassar Word till HTML-konverteringen dynamiskt med olika alternativ. Du kan enkelt bädda in den här funktionen i dina Python-applikationer. Dessutom kan du utforska andra funktioner i Aspose.Words for Python med hjälp av dokumentationen. Du kan också ställa dina frågor via vårt forum.

Se även

Info: Du kanske är intresserad av ett annat Python API (Aspose.Slides for Python via NET) som låter dig konvertera presentationer till bilder och importera bilder till presentationer.