Веб-страницы часто содержат табличные данные, такие как отчеты, прайс-листы или статистика, оформленные в HTML таблицах. Работа с веб-данными зачастую требует конвертации HTML таблиц или страниц в Excel таблицы для анализа или отчетности. Экспорт этих данных в Excel позволяет сортировать, фильтровать и выполнять расчеты. Автоматизация этого процесса с помощью Python обеспечивает точность и экономит время, особенно при обработке больших или повторяющихся наборов данных. В этом руководстве вы узнаете, как конвертировать HTML в Excel с помощью Python всего за несколько строк кода.

Библиотека преобразования Python HTML в Excel

Aspose.Cells for Python via .NET — это высокопроизводительная библиотека автоматизации таблиц, которая позволяет разработчикам на Python создавать, редактировать и конвертировать файлы Excel без использования Microsoft Excel.

Это поддерживает чтение и запись широкого спектра форматов, включая XLS, XLSX, CSV, HTML, ODS и другие. Разработчики также могут манипулировать формулами, применять форматирование, вставлять диаграммы и обрабатывать сложные электронные таблицы программным образом. Эта гибкость делает его идеальным для автоматизации задач, таких как преобразование HTML отчетов, счетов или таблиц в рабочие книги Excel для дальнейшей обработки или распространения.

Прежде чем писать код, загрузите его с releases или установите пакет из PyPI.Запустите следующую команду в вашем терминале:

pip install aspose-cells-python 

Это устанавливает API и его зависимости, готовя его к использованию в любом проекте на Python.

Преобразование HTML в Excel на Python

Aspose.Cells позволяет прямое преобразование файла или строки HTML в книгу Excel. Затем вы можете сохранить его в формате XLSX, XLS или других поддерживаемых форматах.

Следуйте приведенным ниже шагам, чтобы загрузить HTML и сохранить как Excel:

  1. Загрузите файл HTML с помощью класса Workbook.
  2. Сохраните рабочую книгу в формате XLSX.

Следующий образец кода загружает HTML-файл и экспортирует его в формате Excel на Python.

from aspose.cells import Workbook

# Шаг 1: Определите путь к входному HTML файлу
input_file = "sample.html"

# Шаг 2: Создайте объект Workbook и загрузите HTML
workbook = Workbook(input_file)

# Шаг 3: Сохраните файл как Excel
workbook.save("output.xlsx")
Преобразуйте HTML в Excel с помощью Python

Convert HTML to Excel using Python.

Преобразовать HTML-строку в Excel

Иногда HTML-контент доступен в памяти вместо файла. Aspose.Cells позволяет вам напрямую конвертировать HTML-строки, не сохраняя их предварительно. Этот метод идеально подходит для конвертации динамического HTML-контента в файлы Excel на лету, например, в скриптах веб-сканирования или извлечения данных.

Следуйте приведенным ниже шагам, чтобы преобразовать строку HTML в Excel:

  1. Инициализируйте рабочую книгу, используя поток памяти, содержащий HTML-контент.
  2. Сохраните результат в файл Excel.

Следующий образец кода демонстрирует, как экспортировать строку HTML в рабочий лист Excel:

from aspose.cells import Workbook, HtmlLoadOptions
from io import BytesIO

# Шаг 1: Определите строку HTML
html_data = """
<table border='1'>
<tr><th>Product</th><th>Price</th><th>Quantity</th></tr>
<tr><td>Laptop</td><td>800</td><td>5</td></tr>
<tr><td>Phone</td><td>400</td><td>10</td></tr>
</table>
"""

# Шаг 2: Преобразуйте HTML-строку в байты
html_bytes = BytesIO(html_data.encode('utf-8'))

# Шаг 3: Загрузить HTML из памяти
options = HtmlLoadOptions()
workbook = Workbook(html_bytes, options)

# Шаг 4: Сохранить как Excel
workbook.save("from_string.xlsx")
Convert HTML String to Excel using Python

Преобразование HTML-строки в Excel с помощью Python.

Расширенные параметры для конвертации HTML в Excel

Aspose.Cells предоставляет расширенный контроль над тем, как ваши HTML-файлы читаются и сохраняются. Вы можете использовать класс HtmlLoadOptions для работы с встраиваемыми изображениями, форматированием или кодировкой.

Следуйте указанным ниже шагам, чтобы настроить загрузку HTML-файлов:

  1. Создайте экземпляр класса HtmlLoadOptions.
  2. Укажите параметры загрузки HTML.
  3. Загрузите HTML с параметрами, используя класс Workbook.
  4. Сохраните как Excel, используя метод save().

Следующий пример кода использует HtmlLoadOptions для обработки HTML с определенными настройками и сохранения в виде файла Excel.

from aspose.cells import Workbook, HtmlLoadOptions

# Шаг 1: Установите параметры загрузки HTML
load_options = HtmlLoadOptions()
load_options.auto_fit_cols_and_rows = True  # Automatically adjusts columns and rows

# Шаг 2: Загрузите HTML с параметрами
workbook = Workbook("sample.html", load_options)

# Шаг 3: Сохранить как Excel
workbook.save("table_advanced.xlsx")
Преобразование HTML в Excel с использованием Python - Расширенные параметры

Расширенные параметры для конвертации HTML в Excel.

Когда использовать параметры загрузки

Используйте эти параметры, когда:

  • Ваш HTML содержит большие таблицы или объединённые ячейки.
  • Вы хотите сохранить ширину столбцов и стили.
  • You need to auto-adjust the layout for better readability.

Преобразовать HTML в несколько форматов Excel

Aspose.Cells позволяет сохранять вывод в различных форматах таблиц в зависимости от ваших требований. Он обеспечивает интеграцию в потоки данных, панели мониторинга или инструменты автоматизации, требующие различных форматов экспорта.

from aspose.cells import Workbook

workbook = Workbook("sample.html")

# Сохранить в формате XLS
workbook.save("output.xls")

# Сохранить в формате CSV
workbook.save("output.csv")

# Сохранить в PDF для отчетности
workbook.save("output.pdf")

Получите бесплатную лицензию

Оцените Aspose.Cells for Python через .NET без ограничений. Запросите бесплатную временную лицензию на странице Aspose License Page.Примените её в своём коде, чтобы исследовать все премиум функции, от работы с большими файлами до расширенного форматирования и манипуляций с графиками.

Преобразовать HTML в Excel Online

Если вы хотите быстро преобразовать ваш HTML-контент в формат Excel без написания кода, попробуйте онлайн-конвертер Aspose.Cells HTML to Excel online converter.

Бесплатный онлайн-конвертер HTML в Excel
Input file
Output format
  

Это бесплатное веб-приложение работает прямо в вашем браузере и поддерживает несколько форматов, включая HTML, XLS, XLSX, CSV и ODS. Вы можете загрузить файл, выбрать формат вывода и мгновенно скачать преобразованный Excel.

Python HTML to Excel: Бесплатные ресурсы

Кроме преобразования HTML в Excel, Aspose.Cells for Python через .NET поддерживает преобразования файлов, генерацию графиков, формулы, форматирование и сводные таблицы. Разработчики могут использовать его для создания или обработки файлов Excel без Microsoft Office. Используйте следующие ресурсы, чтобы изучить более продвинутые функции:

Заключение

Преобразование HTML в Excel на Python — это мощный способ переноса веб-данных в вашу среду аналитики или отчетности. С помощью Aspose.Cells for Python вы можете выполнить это преобразование всего за несколько строк кода, сохраняя точность, форматирование и производительность. Независимо от того, создаете ли вы скрипт для обработки данных или интегрируете веб-отчеты в панели Excel, Aspose.Cells предоставляет вам все необходимые инструменты.

Есть вопрос или нужна техническая помощь? Посетите наш Free Support Forum, чтобы напрямую связаться с нашими специалистами. Наша команда готова помочь вам решить проблемы и провести вас через ваш проект.

Часто задаваемые вопросы (ЧЗВ)

1. Могу я напрямую конвертировать HTML в Excel, используя Python?

Да. Вы можете напрямую конвертировать любой HTML-файл или строку, содержащую данные таблицы, в Excel с использованием библиотеки Aspose.Cells for Python через .NET. Она считывает структуру HTML и сохраняет таблицы, форматирование и стили в выходном Excel-файле.

2. Поддерживает ли Aspose.Cells конвертацию HTML-строк в Excel?

Абсолютно. Вы можете загрузить HTML-контент из строки или потока памяти вместо файла. Это полезно, когда HTML динамически генерируется из веб-данных, API или ввода пользователя.

3. Какие форматы вывода поддерживаются кроме XLSX?

В дополнение к XLSX вы можете экспортировать ваш HTML в XLS, CSV, ODS, PDF и другие форматы, поддерживаемые Aspose.Cells. Вам просто нужно указать желаемый SaveFormat при сохранении рабочей книги.

4. Мне нужно установить Microsoft Excel, чтобы использовать Aspose.Cells?

Нет. Aspose.Cells — это независимая библиотека Python, которая не зависит от Microsoft Excel или Office. Вы можете выполнять все конверсии программно на любой системе.

5. Существует ли онлайн-инструмент для преобразования HTML в Excel без программирования?

Да, Aspose предлагает бесплатный HTML to Excel online converter, где вы можете загрузить файл HTML и мгновенно скачать выходной файл Excel.

6. Может ли Aspose.Cells обрабатывать большие или сложные HTML-таблицы?

Да. Aspose.Cells разработан для высокопроизводительной обработки данных. Он эффективно обрабатывает большие HTML-файлы, содержащие несколько таблиц, изображений или сложные макеты, обеспечивая точный вывод в Excel.

См. также