Word zu HTML-Python

Die Konvertierung von Word in HTML ist in verschiedenen Fällen erforderlich, z. B. zum Einbetten des Inhalts des Dokuments auf den Webseiten. In diesem Artikel erfahren Sie, wie Sie MS Word DOCX oder DOC Dokumente mit Python in HTML konvertieren. Außerdem erfahren Sie, wie Sie die Konvertierung von Word nach HTML dynamisch über verschiedene Optionen steuern können.

Python Word zu HTML Konverter API

Um Word Dokumente in HTML zu konvertieren, verwenden wir Aspose.Words for Python. Es ist eine leistungsstarke und funktionsreiche API zum Erstellen und Bearbeiten von Word Dokumenten. Außerdem bietet es eine High-Fidelity-Konvertierung von Word Dokumenten in andere Formate. Aspose.Words for Python ist auf PyPI verfügbar und Sie können es mit dem folgenden Pip Befehl installieren.

pip install aspose-words 

Konvertieren Sie ein Word Dokument in Python in HTML

Im Folgenden sind die Schritte zum Konvertieren eines Word Dokuments in eine HTML Datei mit Python aufgeführt.

  • Laden Sie das Word Dokument mithilfe der Document Klasse.
  • Erstellen Sie ein Objekt der HtmlSaveOptions Klasse.
  • Aktivieren Sie den Export von Schriftartressourcen mithilfe der Eigenschaft HtmlSaveOptions.export\font\resources.
  • Konvertieren Sie das Word Dokument mit der methode Document.save() in HTML.

Das folgende Codebeispiel zeigt, wie eine DOCX Datei in Python in HTML konvertiert wird.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Enable export of fonts
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
  
# Save the document as HTML
doc.save("Document.html", options)

Passen Sie die Word zu HTML-Konvertierung in Python an

Aspose.Words for Python bietet auch verschiedene Optionen zum Anpassen der Word zu HTML-Konvertierung. Beispielsweise können Sie Dokumente mit Roundtrip-Informationen konvertieren, den Ordner zum Speichern der Ressourcendateien angeben und so weiter.

Konvertieren Sie ein Word Dokument mit Round-Trip-Informationen

HTML unterstützt nicht alle von MS Word bereitgestellten Funktionen, daher müssen wir, um das Word Dokument in HTML nachzuahmen, zusätzliche Informationen speichern, die als Round-Trip-Informationen bezeichnet werden. Im Folgenden sind die Schritte zum Aktivieren des Exports von Roundtrip-Informationen bei der Word zu HTML-Konvertierung aufgeführt.

  • Laden Sie das Word Dokument mithilfe der Document Klasse.
  • Erstellen Sie ein Objekt der Klasse HtmlSaveOptions und setzen Sie die Eigenschaft HtmlSaveOptions.export\roundtrip\information auf true.
  • Konvertieren Sie das Word Dokument mit der methode Document.save() in HTML und übergeben Sie den Namen der HTML Datei und HtmlSaveOptions als Parameter.

Das folgende Codebeispiel zeigt, wie Roundtrip-Informationen bei der Word zu HTML-Konvertierung exportiert werden.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Enable round-trip information
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True 

# Save the document as HTML
doc.save("Document.html", saveOptions)

Word to HTML: Geben Sie einen Ordner für Ressourcen an

Sie können auch einen Ordner angeben, in dem Sie alle Ressourcen wie Bilder, CSS Dateien und Schriftarten speichern möchten. Dazu können Sie die Eigenschaft HtmlSaveOptions.export\font\resources verwenden. Sie können auch separate Ordner für Schriftarten und Bilder angeben, indem Sie die Eigenschaften HtmlSaveOptions.fonts\folder bzw. HtmlSaveOptions.images\folder verwenden. Im Folgenden finden Sie die Schritte zum Verwenden eines separaten Ordners zum Speichern von Ressourcen bei der Word zu HTML-Konvertierung.

  • Laden Sie das Word Dokument mithilfe der Document Klasse.
  • Erstellen Sie ein Objekt der Klasse HtmlSaveOptions und setzen Sie die Eigenschaft HtmlSaveOptions.export\font\resources auf true.
  • Geben Sie den Namen des Ressourcenordners mit der Eigenschaft HtmlSaveOptions.resource\folder an.
  • Konvertieren Sie das Word Dokument mit der methode Document.save() in HTML und übergeben Sie den Namen der HTML Datei und HtmlSaveOptions als Parameter.

Das folgende Codebeispiel zeigt, wie ein Ressourcenordner in der Word zu HTML-Konvertierung angegeben wird.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Specify resource folder
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"

# Save the document as HTML
doc.save("Document.html", saveOptions)

Holen Sie sich eine kostenlose API Lizenz

Sie können eine temporäre Lizenz erwerben, um Aspose.Words for Python ohne Evaluierungseinschränkungen zu verwenden.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie Word Dokumente mit Python in HTML konvertieren. Außerdem haben Sie gesehen, wie Sie die Word zu HTML-Konvertierung dynamisch anpassen können. Außerdem können Sie andere Funktionen von Aspose.Words for Python mithilfe der Dokumentation erkunden. Sie können Ihre Fragen auch über unser Forum stellen.

Siehe auch

Info: Möglicherweise interessieren Sie sich für eine andere Python-API (Aspose.Slides for Python via NET), mit der Sie Präsentationen in Bilder konvertieren und Bilder in Präsentationen importieren können.