在各種情況下都需要將 Word 轉換為 HTML,例如將文檔的內容嵌入網頁。在本文中,您將學習如何使用 Python 將 MS Word DOCX 或 DOC 文檔轉換為 HTML。此外,您將學習如何使用不同的選項動態控制 Word 到 HTML 的轉換。
Python Word 到 HTML 轉換器 API
為了將 Word 文檔轉換為 HTML,我們將使用 Aspose.Words for Python。它是一個功能強大且功能豐富的 API,用於創建和操作 Word 文檔。此外,它還提供 Word 文檔到其他格式的高保真轉換。 Aspose.Words for Python 在 PyPI 上可用,您可以使用以下 pip 命令安裝它。
pip install aspose-words
在 Python 中將 Word 文檔轉換為 HTML
以下是使用 Python 將 Word 文檔轉換為 HTML 文件的步驟。
- 使用 Document 類加載 Word 文檔。
- 創建 HtmlSaveOptions 類的對象。
- 使用 HtmlSaveOptions.exportfontresources 屬性啟用字體資源導出。
- 使用 Document.save() 方法將 Word 文檔轉換為 HTML。
以下代碼示例顯示瞭如何在 Python 中將 DOCX 文件轉換為 HTML。
import aspose.words as aw
# 從磁盤加載文檔
doc = aw.Document("Document.docx")
# 啟用字體導出
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
# 將文檔另存為 HTML
doc.save("Document.html", options)
在 Python 中自定義 Word 到 HTML 的轉換
Aspose.Words for Python 還提供了不同的選項來自定義 Word 到 HTML 的轉換。例如,您可以轉換帶有往返信息的文檔、指定保存資源文件的文件夾等。
使用往返信息轉換 Word 文檔
HTML 不支持 MS Word 提供的所有功能,因此,為了模仿 HTML 中的 Word 文檔,我們需要保存稱為往返信息的附加信息。以下是在 Word 到 HTML 轉換中打開往返信息導出的步驟。
- 使用 Document 類加載 Word 文檔。
- 創建 HtmlSaveOptions 類的對象並將 HtmlSaveOptions.exportroundtripinformation 屬性設置為 true。
- 使用 Document.save() 方法將 Word 文檔轉換為 HTML,並將 HTML 文件的名稱和 HtmlSaveOptions 作為參數傳遞。
以下代碼示例顯示如何將 Word 中的往返信息導出到 HTML 轉換。
import aspose.words as aw
# 從磁盤加載文檔
doc = aw.Document("Document.docx")
# 啟用往返信息
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True
# 將文檔另存為 HTML
doc.save("Document.html", saveOptions)
Word 到 HTML:為資源指定文件夾
您還可以指定一個文件夾,用於存儲所有資源,例如圖像、CSS 文件和字體。為此,您可以使用 HtmlSaveOptions.exportfontresources 屬性。您還可以分別使用 HtmlSaveOptions.fontsfolder 和 HtmlSaveOptions.imagesfolder 屬性為字體和圖像指定單獨的文件夾。以下是Word轉HTML中使用單獨文件夾保存資源的步驟。
- 使用 Document 類加載 Word 文檔。
- 創建 HtmlSaveOptions 類的對象並將 HtmlSaveOptions.exportfontresources 屬性設置為 true。
- 使用 HtmlSaveOptions.resourcefolder 屬性指定資源文件夾的名稱。
- 使用 Document.save() 方法將 Word 文檔轉換為 HTML,並將 HTML 文件的名稱和 HtmlSaveOptions 作為參數傳遞。
以下代碼示例顯示如何在 Word 到 HTML 轉換中指定資源文件夾。
import aspose.words as aw
# 從磁盤加載文檔
doc = aw.Document("Document.docx")
# 指定資源文件夾
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"
# 將文檔另存為 HTML
doc.save("Document.html", saveOptions)
獲取免費的 API 許可證
您可以獲得臨時許可,以便在沒有評估限制的情況下使用 Aspose.Words for Python。
結論
在本文中,您學習瞭如何使用 Python 將 Word 文檔轉換為 HTML。此外,您還了解瞭如何動態自定義 Word 到 HTML 的轉換。此外,您可以使用 文檔 探索 Aspose.Words for Python 的其他功能。此外,您可以通過我們的 論壇 提問。
也可以看看
信息:您可能對另一個 Python API(Aspose.Slides for Python via NET)感興趣,它允許您將演示文稿轉換為圖像 和將圖像導入演示文稿。