Веб-страницы часто содержат табличные данные, такие как отчеты, прайс-листы или статистика, оформленные в HTML таблицах. Работа с веб-данными зачастую требует конвертации HTML таблиц или страниц в Excel таблицы для анализа или отчетности. Экспорт этих данных в Excel позволяет сортировать, фильтровать и выполнять расчеты. Автоматизация этого процесса с помощью Python обеспечивает точность и экономит время, особенно при обработке больших или повторяющихся наборов данных. В этом руководстве вы узнаете, как конвертировать HTML в Excel с помощью Python всего за несколько строк кода.
Библиотека преобразования Python HTML в Excel
Aspose.Cells for Python via .NET — это высокопроизводительная библиотека автоматизации таблиц, которая позволяет разработчикам на Python создавать, редактировать и конвертировать файлы Excel без использования Microsoft Excel.
Это поддерживает чтение и запись широкого спектра форматов, включая XLS, XLSX, CSV, HTML, ODS и другие. Разработчики также могут манипулировать формулами, применять форматирование, вставлять диаграммы и обрабатывать сложные электронные таблицы программным образом. Эта гибкость делает его идеальным для автоматизации задач, таких как преобразование HTML отчетов, счетов или таблиц в рабочие книги Excel для дальнейшей обработки или распространения.
Прежде чем писать код, загрузите его с releases или установите пакет из PyPI.Запустите следующую команду в вашем терминале:
pip install aspose-cells-python
Это устанавливает API и его зависимости, готовя его к использованию в любом проекте на Python.
Преобразование HTML в Excel на Python
Aspose.Cells позволяет прямое преобразование файла или строки HTML в книгу Excel. Затем вы можете сохранить его в формате XLSX, XLS или других поддерживаемых форматах.
Следуйте приведенным ниже шагам, чтобы загрузить HTML и сохранить как Excel:
- Загрузите файл HTML с помощью класса
Workbook. - Сохраните рабочую книгу в формате XLSX.
Следующий образец кода загружает HTML-файл и экспортирует его в формате Excel на Python.
from aspose.cells import Workbook
# Шаг 1: Определите путь к входному HTML файлу
input_file = "sample.html"
# Шаг 2: Создайте объект Workbook и загрузите HTML
workbook = Workbook(input_file)
# Шаг 3: Сохраните файл как Excel
workbook.save("output.xlsx")

Convert HTML to Excel using Python.
Преобразовать HTML-строку в Excel
Иногда HTML-контент доступен в памяти вместо файла. Aspose.Cells позволяет вам напрямую конвертировать HTML-строки, не сохраняя их предварительно. Этот метод идеально подходит для конвертации динамического HTML-контента в файлы Excel на лету, например, в скриптах веб-сканирования или извлечения данных.
Следуйте приведенным ниже шагам, чтобы преобразовать строку HTML в Excel:
- Инициализируйте рабочую книгу, используя поток памяти, содержащий HTML-контент.
- Сохраните результат в файл Excel.
Следующий образец кода демонстрирует, как экспортировать строку HTML в рабочий лист Excel:
from aspose.cells import Workbook, HtmlLoadOptions
from io import BytesIO
# Шаг 1: Определите строку HTML
html_data = """
<table border='1'>
<tr><th>Product</th><th>Price</th><th>Quantity</th></tr>
<tr><td>Laptop</td><td>800</td><td>5</td></tr>
<tr><td>Phone</td><td>400</td><td>10</td></tr>
</table>
"""
# Шаг 2: Преобразуйте HTML-строку в байты
html_bytes = BytesIO(html_data.encode('utf-8'))
# Шаг 3: Загрузить HTML из памяти
options = HtmlLoadOptions()
workbook = Workbook(html_bytes, options)
# Шаг 4: Сохранить как Excel
workbook.save("from_string.xlsx")

Преобразование HTML-строки в Excel с помощью Python.
Расширенные параметры для конвертации HTML в Excel
Aspose.Cells предоставляет расширенный контроль над тем, как ваши HTML-файлы читаются и сохраняются. Вы можете использовать класс HtmlLoadOptions для работы с встраиваемыми изображениями, форматированием или кодировкой.
Следуйте указанным ниже шагам, чтобы настроить загрузку HTML-файлов:
- Создайте экземпляр класса
HtmlLoadOptions. - Укажите параметры загрузки HTML.
- Загрузите HTML с параметрами, используя класс
Workbook. - Сохраните как Excel, используя метод
save().
Следующий пример кода использует HtmlLoadOptions для обработки HTML с определенными настройками и сохранения в виде файла Excel.
from aspose.cells import Workbook, HtmlLoadOptions
# Шаг 1: Установите параметры загрузки HTML
load_options = HtmlLoadOptions()
load_options.auto_fit_cols_and_rows = True # Automatically adjusts columns and rows
# Шаг 2: Загрузите HTML с параметрами
workbook = Workbook("sample.html", load_options)
# Шаг 3: Сохранить как Excel
workbook.save("table_advanced.xlsx")

Расширенные параметры для конвертации HTML в Excel.
Когда использовать параметры загрузки
Используйте эти параметры, когда:
- Ваш HTML содержит большие таблицы или объединённые ячейки.
- Вы хотите сохранить ширину столбцов и стили.
- You need to auto-adjust the layout for better readability.
Преобразовать HTML в несколько форматов Excel
Aspose.Cells позволяет сохранять вывод в различных форматах таблиц в зависимости от ваших требований. Он обеспечивает интеграцию в потоки данных, панели мониторинга или инструменты автоматизации, требующие различных форматов экспорта.
from aspose.cells import Workbook
workbook = Workbook("sample.html")
# Сохранить в формате XLS
workbook.save("output.xls")
# Сохранить в формате CSV
workbook.save("output.csv")
# Сохранить в PDF для отчетности
workbook.save("output.pdf")
Получите бесплатную лицензию
Оцените Aspose.Cells for Python через .NET без ограничений. Запросите бесплатную временную лицензию на странице Aspose License Page.Примените её в своём коде, чтобы исследовать все премиум функции, от работы с большими файлами до расширенного форматирования и манипуляций с графиками.
Преобразовать HTML в Excel Online
Если вы хотите быстро преобразовать ваш HTML-контент в формат Excel без написания кода, попробуйте онлайн-конвертер Aspose.Cells HTML to Excel online converter.
Это бесплатное веб-приложение работает прямо в вашем браузере и поддерживает несколько форматов, включая HTML, XLS, XLSX, CSV и ODS. Вы можете загрузить файл, выбрать формат вывода и мгновенно скачать преобразованный Excel.
Python HTML to Excel: Бесплатные ресурсы
Кроме преобразования HTML в Excel, Aspose.Cells for Python через .NET поддерживает преобразования файлов, генерацию графиков, формулы, форматирование и сводные таблицы. Разработчики могут использовать его для создания или обработки файлов Excel без Microsoft Office. Используйте следующие ресурсы, чтобы изучить более продвинутые функции:
- Aspose.Cells for Python Официальная Документация
- API Reference
- Бесплатные онлайн инструменты Excel
- Учебные пособия и руководства для разработчиков
Заключение
Преобразование HTML в Excel на Python — это мощный способ переноса веб-данных в вашу среду аналитики или отчетности. С помощью Aspose.Cells for Python вы можете выполнить это преобразование всего за несколько строк кода, сохраняя точность, форматирование и производительность. Независимо от того, создаете ли вы скрипт для обработки данных или интегрируете веб-отчеты в панели Excel, Aspose.Cells предоставляет вам все необходимые инструменты.
Есть вопрос или нужна техническая помощь? Посетите наш Free Support Forum, чтобы напрямую связаться с нашими специалистами. Наша команда готова помочь вам решить проблемы и провести вас через ваш проект.
Часто задаваемые вопросы (ЧЗВ)
1. Могу я напрямую конвертировать HTML в Excel, используя Python?
Да. Вы можете напрямую конвертировать любой HTML-файл или строку, содержащую данные таблицы, в Excel с использованием библиотеки Aspose.Cells for Python через .NET. Она считывает структуру HTML и сохраняет таблицы, форматирование и стили в выходном Excel-файле.
2. Поддерживает ли Aspose.Cells конвертацию HTML-строк в Excel?
Абсолютно. Вы можете загрузить HTML-контент из строки или потока памяти вместо файла. Это полезно, когда HTML динамически генерируется из веб-данных, API или ввода пользователя.
3. Какие форматы вывода поддерживаются кроме XLSX?
В дополнение к XLSX вы можете экспортировать ваш HTML в XLS, CSV, ODS, PDF и другие форматы, поддерживаемые Aspose.Cells. Вам просто нужно указать желаемый SaveFormat при сохранении рабочей книги.
4. Мне нужно установить Microsoft Excel, чтобы использовать Aspose.Cells?
Нет. Aspose.Cells — это независимая библиотека Python, которая не зависит от Microsoft Excel или Office. Вы можете выполнять все конверсии программно на любой системе.
5. Существует ли онлайн-инструмент для преобразования HTML в Excel без программирования?
Да, Aspose предлагает бесплатный HTML to Excel online converter, где вы можете загрузить файл HTML и мгновенно скачать выходной файл Excel.
6. Может ли Aspose.Cells обрабатывать большие или сложные HTML-таблицы?
Да. Aspose.Cells разработан для высокопроизводительной обработки данных. Он эффективно обрабатывает большие HTML-файлы, содержащие несколько таблиц, изображений или сложные макеты, обеспечивая точный вывод в Excel.
