Webové stránky často obsahují tabulková data, jako jsou zprávy, cenové seznamy nebo statistiky, formátované v HTML tabulkách. Práce s webovými daty často vyžaduje převod HTML tabulek nebo stránek do Excelových tabulek pro analýzu nebo reportování. Export těchto dat do Excelu umožňuje třídění, filtrování a výpočty. Automatizace tohoto procesu pomocí Pythonu zajišťuje přesnost a šetří čas, zejména při zpracovávání velkých nebo opakujících se datových sad. V této příručce se naučíte, jak převést HTML na Excel v Pythonu pomocí několika řádků kódu.

Python HTML to Excel Converter Library

Aspose.Cells for Python via .NET je vysoce výkonná knihovna pro automatizaci tabulek, která umožňuje vývojářům v Pythonu vytvářet, upravovat a převádět soubory Excel bez použití Microsoft Excel.

Podporuje čtení a psaní široké škály formátů, včetně XLS, XLSX, CSV, HTML, ODS a dalších. Vývojáři mohou také manipulovat s formuláři, aplikovat formátování, vkládat grafy a programově zpracovávat složité tabulky. Tato flexibilita jej činí ideálním pro automatizační úkoly, jako je převod HTML zpráv, faktur nebo tabulek do Excel sešitů pro další zpracování nebo distribuci.

Před psaním kódu jej stáhněte z releases nebo nainstalujte balíček z PyPI.Spusťte následující příkaz ve svém terminálu:

pip install aspose-cells-python 

Tímto se nainstaluje API a jeho závislosti, což jej připraví k použití v jakémkoli projektu v Pythonu.

Convert HTML to Excel in Python

Aspose.Cells umožňuje přímou konverzi souboru HTML nebo řetězce do sešitu Excel. Poté jej můžete uložit jako XLSX, XLS nebo jiné podporované formáty.

Postupujte podle následujících kroků pro načtení HTML a uložení jako Excel:

  1. Načtěte HTML soubor pomocí třídy Workbook.
  2. Uložte pracovní sešit ve formátu XLSX.

Následující ukázka kódu načte soubor HTML a exportuje ho do formátu Excel v Pythonu.

from aspose.cells import Workbook

# Krok 1: Definujte cestu k vstupnímu HTML souboru
input_file = "sample.html"

# Krok 2: Vytvořte objekt Workbook a načtěte HTML
workbook = Workbook(input_file)

# Krok 3: Uložte soubor jako Excel
workbook.save("output.xlsx")
Convert HTML to Excel using Python

Convert HTML to Excel using Python.

Convert HTML String to Excel

Někdy je HTML obsah k dispozici v paměti místo v souboru. Aspose.Cells vám umožňuje přímo převádět HTML řetězce, aniž byste je nejprve ukládali. Tato metoda je ideální pro převod dynamického HTML obsahu do Excelových souborů na vyžádání, například při webovém skenování nebo skriptech pro extrakci dat.

Postupujte podle níže uvedených kroků pro převod HTML řetězce na Excel:

  1. Inicializujte pracovní sešit pomocí paměťového proudu obsahujícího HTML obsah.
  2. Uložte výsledek jako soubor Excel.

Následující ukázka kódu ukazuje, jak exportovat HTML řetězec do pracovní tabulky Excel:

from aspose.cells import Workbook, HtmlLoadOptions
from io import BytesIO

# Krok 1: Definujte HTML řetězec
html_data = """
<table border='1'>
<tr><th>Product</th><th>Price</th><th>Quantity</th></tr>
<tr><td>Laptop</td><td>800</td><td>5</td></tr>
<tr><td>Phone</td><td>400</td><td>10</td></tr>
</table>
"""

# Krok 2: Převeďte HTML řetězec na byty
html_bytes = BytesIO(html_data.encode('utf-8'))

# Krok 3: Načíst HTML z paměti
options = HtmlLoadOptions()
workbook = Workbook(html_bytes, options)

# Krok 4: Uložit jako Excel
workbook.save("from_string.xlsx")
Convert HTML String to Excel using Python

Convert HTML String to Excel using Python.

Pokročilé možnosti pro převod HTML na Excel

Aspose.Cells poskytuje pokročilou kontrolu nad tím, jak jsou vaše soubory HTML čteny a ukládány. Můžete použít třídu HtmlLoadOptions k zpracování vložených obrázků, formátování nebo kódování.

Postupujte podle níže uvedených kroků pro přizpůsobení načítání HTML souborů:

  1. Vytvořte instanci třídy HtmlLoadOptions.
  2. Specify HTML load options.
  3. Načtěte HTML s možnostmi pomocí třídy Workbook.
  4. Uložte jako Excel pomocí metody save().

Následující příklad kódu používá HtmlLoadOptions k zpracování HTML s konkrétními nastaveními a uložení jako Excel soubor.

from aspose.cells import Workbook, HtmlLoadOptions

# Krok 1: Nastavte možnosti načítání HTML
load_options = HtmlLoadOptions()
load_options.auto_fit_cols_and_rows = True  # Automatically adjusts columns and rows

# Krok 2: Načíst HTML s možnostmi
workbook = Workbook("sample.html", load_options)

# Krok 3: Uložit jako Excel
workbook.save("table_advanced.xlsx")
Převod HTML na Excel pomocí Pythonu - Rozšířené možnosti

Pokročilé možnosti pro převod HTML na Excel.

Kdy použít možnosti načítání

Použijte tyto možnosti, když:

  • Váš HTML obsahuje velké tabulky nebo sloučené buňky.
  • Chcete zachovat šířky sloupců a styly.
  • You need to auto-adjust the layout for better readability.

Převod HTML do více formátů Excel

Aspose.Cells umožňuje ukládat výstup v různých formátech tabulek na základě vašich požadavků. Umožňuje integraci do datových kanálů, řídicích panelů nebo automatizačních nástrojů vyžadujících různé formáty exportu.

from aspose.cells import Workbook

workbook = Workbook("sample.html")

# Uložit ve formátu XLS
workbook.save("output.xls")

# Uložit do formátu CSV
workbook.save("output.csv")

# Uložit jako PDF pro zprávu
workbook.save("output.pdf")

Získejte bezplatnou licenci

Hodnoťte Aspose.Cells for Python přes .NET bez omezení. Požádejte o bezplatnou dočasnou licenci na Aspose License Page.Aplikujte ji ve svém kódu, abyste prozkoumali všechny prémiové funkce, od zpracování velkých souborů až po pokročilé formátování a manipulaci s grafy.

Convert HTML to Excel Online

Pokud chcete rychle převést svůj HTML obsah do formátu Excel bez psaní kódu, vyzkoušejte Aspose.Cells HTML to Excel online converter.

Bezplatný online převodník HTML na Excel
Input file
Output format
  

Tato bezplatná webová aplikace funguje přímo ve vašem prohlížeči a podporuje více formátů, včetně HTML, XLS, XLSX, CSV a ODS. Můžete nahrát soubor, vybrat výstupní formát a okamžitě stáhnout převedený Excel.

Python HTML to Excel: Bezplatné zdroje

Kromě převodu HTML na Excel, Aspose.Cells for Python prostřednictvím .NET podporuje převody souborů, generování grafů, vzorce, formátování a kontingenční tabulky. Vývojáři jej mohou použít k vytváření nebo zpracovávání souborů Excel bez Microsoft Office. Využijte následující zdroje k prozkoumání pokročilejších funkcí:

Závěr

Převod HTML na Excel v Pythonu je mocný způsob, jak přenést webová data do vašeho analytického nebo reportovacího prostředí. S Aspose.Cells for Python můžete tento převod provést s pouze několika řádky kódu, přičemž zachováte přesnost, formátování a výkon. Ať už vytváříte skript pro zpracování dat nebo integrujete webové reporty do Excelových panelů, Aspose.Cells vám poskytuje všechny nástroje, které potřebujete.

Máte otázku nebo potřebujete technickou pomoc? Navštivte naše Free Support Forum, abyste se přímo spojili s našimi odborníky. Náš tým je připraven vám pomoci vyřešit problémy a provést vás vaším projektem.

Často kladené otázky (FAQ)

1. Mohu převést HTML přímo na Excel pomocí Pythonu?

Ano. Můžete převést jakýkoli soubor HTML nebo řetězec obsahující data tabulek přímo do Excelu pomocí knihovny Aspose.Cells for Python prostřednictvím .NET. Čte strukturu HTML a zachovává tabulky, formátování a styly v výstupním souboru Excel.

2. Podporuje Aspose.Cells převod HTML řetězců na Excel?

Absolutně. Můžete načíst HTML obsah ze řetězce nebo paměťového proudu místo souboru. To je užitečné, když je HTML dynamicky generováno z webových dat, API nebo uživatelského vstupu.

3. Jaké formáty výstupu jsou podporovány kromě XLSX?

Kromě XLSX můžete exportovat svůj HTML do XLS, CSV, ODS, PDF a dalších formátů podporovaných Aspose.Cells. Stačí pouze specifikovat požadovaný SaveFormat při ukládání sešitu.

4. Potřebuji mít nainstalovaný Microsoft Excel, abych mohl používat Aspose.Cells?

Ne. Aspose.Cells je samostatná knihovna Python, která nezávisí na Microsoft Excel nebo Office. Můžete provádět všechny konverze programově na jakémkoli systému.

5. Je nějaký online nástroj na převod HTML na Excel bez programování?

Ano, Aspose nabízí bezplatný HTML to Excel online converter, kde můžete nahrát HTML soubor a okamžitě stáhnout Excel výstup.

6. Může Aspose.Cells zpracovávat velké nebo složité HTML tabulky?

Ano. Aspose.Cells je navržen pro vysoce výkonné zpracování dat. Efektivně zpracovává velké HTML soubory obsahující více tabulek, obrázků nebo složitých rozvržení, což zajišťuje přesný výstup v Excelu.

See Also