Веб-сторінки часто містять табличні дані, такі як звіти, списки цін або статистику, відформатовану в HTML таблицях. Робота з веб-даними часто вимагає конвертації HTML таблиць або сторінок у електронні таблиці Excel для аналізу або звітності. Експортування їх в Excel дозволяє виконувати сортування, фільтрацію та обчислення. Автоматизація цього процесу за допомогою Python забезпечує точність і економить час, особливо при обробці великих або повторюваних наборів даних. У цьому посібнику ви дізнаєтеся, як конвертувати HTML в Excel за допомогою Python всього за кілька рядків коду.

Бібліотека конвертера HTML в Excel для Python

Aspose.Cells for Python via .NET є високопродуктивною бібліотекою для автоматизації електронних таблиць, яка дозволяє розробникам Python створювати, редагувати та конвертувати файли Excel без використання Microsoft Excel.

Він підтримує читання та запис широкого спектру форматів, включаючи XLS, XLSX, CSV, HTML, ODS та інші. Розробники також можуть маніпулювати формулами, застосовувати форматування, вставляти діаграми та обробляти складні електронні таблиці програмно. Ця гнучкість робить його ідеальним для автоматизації завдань, таких як перетворення HTML звітів, рахунків або таблиць на робочі книги Excel для подальшої обробки чи розповсюдження.

Перед написанням коду завантажте його з releases або встановіть пакет з PyPI.Виконайте наступну команду у вашому терміналі:

pip install aspose-cells-python 

Це встановлює API та його залежності, готуючи його до використання в будь-якому проекті на Python.

Convert HTML to Excel in Python

Aspose.Cells дозволяє безпосередню конвертацію HTML-файлу або рядка в робочу книгу Excel. Ви можете зберегти його у форматах XLSX, XLS або інших підтримуваних форматах.

Слідуйте наведеним крокам, щоб завантажити HTML та зберегти як Excel:

  1. Завантажте HTML файл за допомогою класу Workbook.
  2. Збережіть робочий зошит у форматі XLSX.

Наступний код завантажує HTML файл і експортує його у формат Excel на Python.

from aspose.cells import Workbook

# Крок 1: Визначити шлях до вхідного HTML-файлу
input_file = "sample.html"

# Крок 2: Створіть об'єкт Workbook і завантажте HTML
workbook = Workbook(input_file)

# Крок 3: Збережіть файл як Excel
workbook.save("output.xlsx")
Перетворення HTML в Excel за допомогою Python

Convert HTML to Excel using Python.

Convert HTML String to Excel

Інколи HTML-контент доступний у пам’яті, а не у файлі. Aspose.Cells дозволяє вам безпосередньо конвертувати HTML-рядки без попереднього їх збереження. Цей метод ідеально підходить для конвертації динамічного HTML-контенту в Excel-файли на льоту, наприклад, в сценаріях веб-скрапінгу або витягування даних.

Слідуйте наведеним нижче крокам, щоб конвертувати HTML-рядок в Excel:

  1. Ініціалізуйте робочий зошит, використовуючи потік пам’яті, що містить HTML-контент.
  2. Save the result as an Excel file.

Наступний зразок коду показує, як експортувати HTML-рядок у робочий лист Excel:

from aspose.cells import Workbook, HtmlLoadOptions
from io import BytesIO

# Крок 1: Визначте HTML рядок
html_data = """
<table border='1'>
<tr><th>Product</th><th>Price</th><th>Quantity</th></tr>
<tr><td>Laptop</td><td>800</td><td>5</td></tr>
<tr><td>Phone</td><td>400</td><td>10</td></tr>
</table>
"""

# Крок 2: Перетворити HTML-рядок в байти
html_bytes = BytesIO(html_data.encode('utf-8'))

# Крок 3: Завантажте HTML з пам'яті
options = HtmlLoadOptions()
workbook = Workbook(html_bytes, options)

# Крок 4: Зберегти як Excel
workbook.save("from_string.xlsx")
Convert HTML String to Excel using Python

Convert HTML String to Excel using Python.

Розширені параметри для конвертації HTML в Excel

Aspose.Cells надає розширений контроль над тим, як ваші HTML файли читаються та зберігаються. Ви можете використовувати клас HtmlLoadOptions для обробки вбудованих зображень, форматування чи кодування.

Слідкуйте за наведеними нижче кроками, щоб налаштувати завантаження HTML-файлів:

  1. Створіть екземпляр класу HtmlLoadOptions.
  2. Вкажіть параметри завантаження HTML.
  3. Завантажте HTML з параметрами, використовуючи клас Workbook.
  4. Збережіть як Excel, використовуючи метод save().

Наступний приклад коду використовує HtmlLoadOptions для обробки HTML з конкретними налаштуваннями та збереження у файл Excel.

from aspose.cells import Workbook, HtmlLoadOptions

# Крок 1: Встановіть параметри завантаження HTML
load_options = HtmlLoadOptions()
load_options.auto_fit_cols_and_rows = True  # Automatically adjusts columns and rows

# Крок 2: Завантажте HTML з параметрами
workbook = Workbook("sample.html", load_options)

# Крок 3: Зберегти як Excel
workbook.save("table_advanced.xlsx")
Перетворення HTML в Excel за допомогою Python - Розширені параметри

Розширені параметри для конвертації HTML в Excel.

Коли використовувати параметри завантаження

Використовуйте ці варіанти, коли:

  • Ваш HTML містить великі таблиці або об’єднані комірки.
  • Ви хочете зберегти ширини стовпців та стилі.
  • Вам потрібно автоматично відрегулювати макет для кращої читабельності.

Перетворення HTML на кілька форматів Excel

Aspose.Cells дозволяє зберігати вихідні дані у різних форматах електронних таблиць відповідно до ваших вимог. Це дозволяє інтеграцію у інформаційні потоки, панелі моніторингу або інструменти автоматизації, які потребують різних форматів експорту.

from aspose.cells import Workbook

workbook = Workbook("sample.html")

# Зберегти у форматі XLS
workbook.save("output.xls")

# Зберегти у форматі CSV
workbook.save("output.csv")

# Зберегти у PDF для звітування
workbook.save("output.pdf")

Отримайте безкоштовну ліцензію

Оцінюйте Aspose.Cells for Python через .NET без обмежень. Запросіть безкоштовну тимчасову ліцензію на Aspose License Page.Застосуйте її у вашому коді, щоб дослідити всі преміум можливості, від роботи з великими файлами до розширеного форматування та маніпуляцій з діаграмами.

Convert HTML to Excel Online

Якщо ви хочете швидко перетворити свій HTML-контент у формат Excel без написання коду, спробуйте онлайн-конвертер Aspose.Cells HTML to Excel online converter.

Безкоштовний онлайн конвертер HTML в Excel
Input file
Output format
  

Цей безкоштовний веб-додаток працює безпосередньо у вашому браузері та підтримує кілька форматів, включаючи HTML, XLS, XLSX, CSV та ODS. Ви можете завантажити файл, вибрати формат виходу та миттєво завантажити перетворений Excel.

Python HTML to Excel: Безкоштовні ресурси

Крім перетворення HTML в Excel, Aspose.Cells for Python через .NET підтримує перетворення файлів, створення діаграм, формули, форматування та зведені таблиці. Розробники можуть використовувати його для створення або обробки файлів Excel без Microsoft Office. Використовуйте наступні ресурси, щоб дослідити більш просунуті функції:

Висновок

Перетворення HTML в Excel на Python є потужним способом перенесення даних з вебу у вашу аналітику чи звітність. З Aspose.Cells for Python ви можете виконати це перетворення всього лише за кілька рядків коду, зберігаючи точність, форматування та продуктивність. Незалежно від того, чи створюєте ви сценарій обробки даних, чи інтегруєте веб-звіти в інформаційні панелі Excel, Aspose.Cells надає вам всі необхідні інструменти.

Маєте питання або потрібна технічна допомога? Відвідайте наш Free Support Forum, щоб зв’язатися безпосередньо з нашими експертами. Наша команда готова допомогти вам вирішити проблеми та провести вас через ваш проект.

Часто задавані питання (FAQs)

1. Чи можу я безпосередньо конвертувати HTML в Excel за допомогою Python?

Так. Ви можете конвертувати будь-який HTML файл або рядок, що містить дані таблиці, безпосередньо в Excel, використовуючи бібліотеку Aspose.Cells for Python через .NET. Вона читає структуру HTML і зберігає таблиці, форматування та стилі в вихідному Excel файлі.

2. Чи підтримує Aspose.Cells конвертацію HTML-рядків в Excel?

Абсолютно. Ви можете завантажити HTML-контент із рядка або пам`яті замість файлу. Це корисно, коли HTML динамічно генерується з веб-даних, API або введення користувача.

3. Які формати виходу підтримуються, крім XLSX?

Крім XLSX, ви можете експортувати ваш HTML у XLS, CSV, ODS, PDF та інші формати, підтримувані Aspose.Cells. Вам просто потрібно вказати бажаний SaveFormat під час збереження робочої книги.

4. Чи потрібно мені встановлювати Microsoft Excel, щоб використовувати Aspose.Cells?

Ні. Aspose.Cells - це самостійна бібліотека Python, яка не залежить від Microsoft Excel або Office. Ви можете виконувати всі конверсії програмно на будь-якій системі.

5. Чи існує онлайн-інструмент для конвертації HTML в Excel без програмування?

Так, Aspose пропонує безкоштовний HTML to Excel online converter, де ви можете завантажити файл HTML і миттєво завантажити вихідний файл Excel.

6. Чи може Aspose.Cells обробляти великі або складні HTML-таблиці?

Так. Aspose.Cells розроблений для високопродуктивної обробки даних. Він ефективно управляє великими HTML-файлами, що містять кілька таблиць, зображень або складних макетів, забезпечуючи точний вихід у форматі Excel.

Дивіться також