網頁經常包含表格數據,例如報告、價格清單或統計數據,這些數據格式化為 HTML 表格。處理網絡數據通常需要將 HTML 表格或頁面轉換為 Excel 電子表格以進行分析或報告。將這些數據導出到 Excel 允許進行排序、篩選和計算。使用 Python 自動化此過程可以確保準確性並節省時間,特別是在處理大型或重複的數據集時。在本指南中,您將學習如何用幾行代碼在 Python 中將 HTML 轉換為 Excel。
Python HTML to Excel 轉換器庫
Aspose.Cells for Python via .NET 是一個高性能的試算表自動化庫,允許 Python 開發者創建、編輯和轉換 Excel 文件,而無需使用 Microsoft Excel。
它支持讀取和寫入廣泛的格式,包括 XLS、XLSX、CSV、HTML、ODS 等等。開發人員還可以程序化地操作公式、應用格式、插入圖表以及處理複雜的電子表格。這種靈活性使其非常適合自動化任務,例如將 HTML 報告、發票或表格轉換為 Excel 工作簿以便進一步處理或分發。
在編寫代碼之前,請從 releases 下載或從 PyPI 安裝該套件。請在終端中運行以下命令:
pip install aspose-cells-python
這會安裝 API 及其依賴項,使其準備在任何 Python 項目中使用。
將 HTML 轉換為 Excel 在 Python 中
Aspose.Cells 允許將 HTML 檔案或字串直接轉換為 Excel 活頁簿。然後,您可以將其保存為 XLSX、XLS 或其他支持的格式。
按照以下步驟加載 HTML 並保存為 Excel:
- 使用
Workbook類別加載 HTML 文件。 - 將工作簿儲存為 XLSX 格式。
以下的代碼範例在 Python 中加載一個 HTML 文件並將其導出為 Excel 格式。
from aspose.cells import Workbook
# 步驟 1:定義輸入 HTML 文件路徑
input_file = "sample.html"
# 步驟 2:創建一個工作簿對象並加載 HTML
workbook = Workbook(input_file)
# 步驟 3:將文件保存為 Excel
workbook.save("output.xlsx")

將 HTML 轉換為 Excel 使用 Python。
將 HTML 字串轉換為 Excel
有時,HTML 內容可用於內存中,而不是文件。Aspose.Cells 允許您直接轉換 HTML 字符串而無需先保存它們。這種方法非常適合將動態 HTML 內容即時轉換為 Excel 文件,例如在網頁抓取或數據提取腳本中。
遵循以下步驟將 HTML 字串轉換為 Excel:
- 使用包含 HTML 內容的內存流初始化工作簿。
- 將結果保存為 Excel 文件。
以下代碼範例展示如何將 HTML 字串匯出到 Excel 工作表:
from aspose.cells import Workbook, HtmlLoadOptions
from io import BytesIO
# 第 1 步:定義 HTML 字串
html_data = """
<table border='1'>
<tr><th>Product</th><th>Price</th><th>Quantity</th></tr>
<tr><td>Laptop</td><td>800</td><td>5</td></tr>
<tr><td>Phone</td><td>400</td><td>10</td></tr>
</table>
"""
# 步驟 2:將 HTML 字串轉換為位元組
html_bytes = BytesIO(html_data.encode('utf-8'))
# 步驟 3: 從記憶體載入 HTML
options = HtmlLoadOptions()
workbook = Workbook(html_bytes, options)
# 步驟 4:另存為 Excel
workbook.save("from_string.xlsx")

Convert HTML String to Excel using Python.
HTML 轉 Excel 轉換的進階選項
Aspose.Cells 提供了對於您的 HTML 文件的讀取和保存的高級控制。您可以使用 HtmlLoadOptions 類來處理嵌入圖像、格式或編碼。
請按照下列步驟自訂 HTML 文件的加載:
- 創建
HtmlLoadOptions類的實例。 - 指定 HTML 加載選項。
- 使用
Workbook類加載帶有選項的 HTML。 - 使用
save()方法另存為 Excel 檔案。
以下代碼示例使用 HtmlLoadOptions 來處理具有特定設置的 HTML 並保存為 Excel 文件。
from aspose.cells import Workbook, HtmlLoadOptions
# 步驟 1:設置 HTML 載入選項
load_options = HtmlLoadOptions()
load_options.auto_fit_cols_and_rows = True # Automatically adjusts columns and rows
# 步驟 2:加載帶選項的 HTML
workbook = Workbook("sample.html", load_options)
# 步驟 3:另存為 Excel
workbook.save("table_advanced.xlsx")

HTML 轉 Excel 轉換的進階選項。
何時使用加載選項
使用這些選項時:
- 您的 HTML 包含大型表格或合併的單元格。
- 您想要保持欄位寬度和樣式。
- 您需要自動調整佈局以改善可讀性。
將 HTML 轉換為多種 Excel 格式
Aspose.Cells 允許根據您的要求將輸出保存為不同的電子表格格式。它使得集成到需要不同導出格式的數據管道、儀表板或自動化工具中變得可能。
from aspose.cells import Workbook
workbook = Workbook("sample.html")
# 儲存為 XLS 格式
workbook.save("output.xls")
# 保存為 CSV 格式
workbook.save("output.csv")
# 保存為 PDF 以便報告
workbook.save("output.pdf")
獲取免費許可證
評估 Aspose.Cells for Python via .NET,無任何限制。請從 Aspose License Page 請求一個免費的臨時許可證。在您的代碼中應用它,以探索所有的高級功能,從大型文件處理到高級格式化和圖表操作。
將 HTML 轉換為 Excel 在線
如果您想快速將您的 HTML 內容轉換為 Excel 格式,而無需編寫代碼,請嘗試 Aspose.Cells HTML to Excel online converter。
這個免費的網頁應用程式可以直接在您的瀏覽器中使用,並支持多種格式,包括 HTML、XLS、XLSX、CSV 和 ODS。您可以上傳一個文件,選擇輸出格式,並立即下載轉換後的 Excel。
Python HTML to Excel: 免費資源
除了將 HTML 轉換為 Excel,Aspose.Cells for Python via .NET 還支持文件轉換、圖表生成、公式、格式設置和透視表。開發人員可以使用它來創建或處理 Excel 文件,而無需 Microsoft Office。請利用以下資源來探索更多高級功能:
結論
在 Python 中將 HTML 轉換為 Excel 是將基於網絡的數據引入分析或報告環境的強大方法。使用 Aspose.Cells for Python,您只需幾行代碼即可執行此轉換,同時保持準確性、格式和性能。無論您是在構建數據處理腳本還是將網絡報告集成到 Excel 儀表板中,Aspose.Cells 都為您提供了所需的所有工具。
有問題或需要技術幫助嗎?請訪問我們的 Free Support Forum 以直接與我們的專家聯繫。我們的團隊已準備好幫助您解決問題並指導您完成項目。
常見問題 (FAQs)
1. 我可以直接使用 Python 將 HTML 轉換為 Excel 嗎?
是的。您可以使用 Aspose.Cells for Python via .NET 庫將任何包含表格數據的 HTML 文件或字符串直接轉換為 Excel。它讀取 HTML 結構,並在輸出 Excel 文件中保留表格、格式和樣式。
2. Aspose.Cells 是否支援將 HTML 字串轉換為 Excel?
絕對可以。您可以從字符串或內存流加載 HTML 內容,而不是從文件中加載。這在 HTML 動態生成自網絡數據、API 或用戶輸入時非常有用。
3. 除了 XLSX,還支持哪些輸出格式?
除了 XLSX,您可以將 HTML 另存為 XLS、CSV、ODS、PDF 及 Aspose.Cells 支援的其他格式。您只需在保存工作簿時指定所需的 SaveFormat。
4. 我需要安裝 Microsoft Excel 才能使用 Aspose.Cells 嗎?
不。Aspose.Cells 是一個獨立的 Python 庫,並不依賴於 Microsoft Excel 或 Office。您可以在任何系統上以程式方式執行所有轉換。
5. 網上有沒有不需要編碼就能將 HTML 轉換為 Excel 的工具?
是的,Aspose 提供一個免費的 HTML to Excel online converter,您可以上傳 HTML 文件並立即下載 Excel 輸出。
6. Aspose.Cells 能處理大型或複雜的 HTML 表格嗎?
是的。Aspose.Cells 是為高性能數據處理而設計的。它高效地處理包含多個表格、圖像或複雜佈局的大型 HTML 文件,確保準確的 Excel 輸出。
