Word 到 HTML Python

在各種情況下都需要將 Word 轉換為 HTML,例如將文檔的內容嵌入網頁。在本文中,您將學習如何使用 Python 將 MS Word DOCXDOC 文檔轉換為 HTML。此外,您將學習如何使用不同的選項動態控制 Word 到 HTML 的轉換。

Python Word 到 HTML 轉換器 API

為了將 Word 文檔轉換為 HTML,我們將使用 Aspose.Words for Python。它是一個功能強大且功能豐富的 API,用於創建和操作 Word 文檔。此外,它還提供 Word 文檔到其他格式的高保真轉換。 Aspose.Words for Python 在 PyPI 上可用,您可以使用以下 pip 命令安裝它。

pip install aspose-words 

在 Python 中將 Word 文檔轉換為 HTML

以下是使用 Python 將 Word 文檔轉換為 HTML 文件的步驟。

  • 使用 Document 類加載 Word 文檔。
  • 創建 HtmlSaveOptions 類的對象。
  • 使用 HtmlSaveOptions.exportfontresources 屬性啟用字體資源導出。
  • 使用 Document.save() 方法將 Word 文檔轉換為 HTML。

以下代碼示例顯示瞭如何在 Python 中將 DOCX 文件轉換為 HTML。

import aspose.words as aw

# 從磁盤加載文檔
doc = aw.Document("Document.docx")

# 啟用字體導出
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
  
# 將文檔另存為 HTML
doc.save("Document.html", options)

在 Python 中自定義 Word 到 HTML 的轉換

Aspose.Words for Python 還提供了不同的選項來自定義 Word 到 HTML 的轉換。例如,您可以轉換帶有往返信息的文檔、指定保存資源文件的文件夾等。

使用往返信息轉換 Word 文檔

HTML 不支持 MS Word 提供的所有功能,因此,為了模仿 HTML 中的 Word 文檔,我們需要保存稱為往返信息的附加信息。以下是在 Word 到 HTML 轉換中打開往返信息導出的步驟。

  • 使用 Document 類加載 Word 文檔。
  • 創建 HtmlSaveOptions 類的對象並將 HtmlSaveOptions.exportroundtripinformation 屬性設置為 true。
  • 使用 Document.save() 方法將 Word 文檔轉換為 HTML,並將 HTML 文件的名稱和 HtmlSaveOptions 作為參數傳遞。

以下代碼示例顯示如何將 Word 中的往返信息導出到 HTML 轉換。

import aspose.words as aw

# 從磁盤加載文檔
doc = aw.Document("Document.docx")

# 啟用往返信息
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True 

# 將文檔另存為 HTML
doc.save("Document.html", saveOptions)

Word 到 HTML:為資源指定文件夾

您還可以指定一個文件夾,用於存儲所有資源,例如圖像、CSS 文件和字體。為此,您可以使用 HtmlSaveOptions.exportfontresources 屬性。您還可以分別使用 HtmlSaveOptions.fontsfolder 和 HtmlSaveOptions.imagesfolder 屬性為字體和圖像指定單獨的文件夾。以下是Word轉HTML中使用單獨文件夾保存資源的步驟。

  • 使用 Document 類加載 Word 文檔。
  • 創建 HtmlSaveOptions 類的對象並將 HtmlSaveOptions.exportfontresources 屬性設置為 true。
  • 使用 HtmlSaveOptions.resourcefolder 屬性指定資源文件夾的名稱。
  • 使用 Document.save() 方法將 Word 文檔轉換為 HTML,並將 HTML 文件的名稱和 HtmlSaveOptions 作為參數傳遞。

以下代碼示例顯示如何在 Word 到 HTML 轉換中指定資源文件夾。

import aspose.words as aw

# 從磁盤加載文檔
doc = aw.Document("Document.docx")

# 指定資源文件夾
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"

# 將文檔另存為 HTML
doc.save("Document.html", saveOptions)

獲取免費的 API 許可證

您可以獲得臨時許可,以便在沒有評估限制的情況下使用 Aspose.Words for Python。

結論

在本文中,您學習瞭如何使用 Python 將 Word 文檔轉換為 HTML。此外,您還了解瞭如何動態自定義 Word 到 HTML 的轉換。此外,您可以使用 文檔 探索 Aspose.Words for Python 的其他功能。此外,您可以通過我們的 論壇 提問。

也可以看看

信息:您可能對另一個 Python API(Aspose.Slides for Python via NET)感興趣,它允許您將演示文稿轉換為圖像將圖像導入演示文稿