As páginas da web frequentemente contêm dados tabulares, como relatórios, listas de preços ou estatísticas, formatados em HTML tabelas. Trabalhar com dados da web muitas vezes requer a conversão de tabelas ou páginas HTML em planilhas do Excel para análise ou relatórios. Exportar esses dados para o Excel permite classificação, filtragem e cálculos. Automatizar esse processo com Python garante precisão e economiza tempo, especialmente ao processar conjuntos de dados grandes ou repetitivos. Neste guia, você aprenderá como converter HTML em Excel no Python com apenas algumas linhas de código.

Biblioteca de Conversão de HTML para Excel em Python

Aspose.Cells for Python via .NET é uma biblioteca de automação de planilhas de alto desempenho que permite que desenvolvedores Python criem, editem e convertam arquivos do Excel sem o uso do Microsoft Excel.

Ele suporta leitura e escrita de uma ampla variedade de formatos, incluindo XLS, XLSX, CSV, HTML, ODS e mais. Os desenvolvedores também podem manipular fórmulas, aplicar formatação, inserir gráficos e processar planilhas complexas programaticamente. Essa flexibilidade torna ideal para tarefas de automação, como converter relatórios HTML, faturas ou tabelas em pastas de trabalho do Excel para processamento ou distribuição posterior.

Antes de escrever o código, baixe-o do releases ou instale o pacote do PyPI.Execute o seguinte comando no seu terminal:

pip install aspose-cells-python 

Isso instala a API e suas dependências, tornando-a pronta para uso em qualquer projeto Python.

Converter HTML para Excel em Python

Aspose.Cells permite a conversão direta de um arquivo HTML ou string em uma pasta de trabalho do Excel. Você pode então salvá-lo como XLSX, XLS ou outros formatos suportados.

Siga os passos abaixo para carregar HTML e salvar como Excel:

  1. Carregue o arquivo HTML usando a classe Workbook.
  2. Salve a pasta de trabalho no formato XLSX.

O seguinte exemplo de código carrega um arquivo HTML e o exporta para o formato Excel em Python.

from aspose.cells import Workbook

# Passo 1: Defina o caminho do arquivo HTML de entrada
input_file = "sample.html"

# Passo 2: Crie um objeto Workbook e carregue o HTML
workbook = Workbook(input_file)

# Passo 3: Salve o arquivo como Excel
workbook.save("output.xlsx")
Converter HTML para Excel usando Python

Convert HTML to Excel using Python.

Converter String HTML para Excel

Às vezes, o conteúdo HTML está disponível na memória em vez de um arquivo. Aspose.Cells permite que você converta strings HTML diretamente sem precisar salvá-las primeiro. Este método é perfeito para converter conteúdo HTML dinâmico em arquivos Excel instantaneamente, como em scripts de raspagem da web ou extração de dados.

Siga os passos abaixo para converter uma string HTML em Excel:

  1. Inicialize a pasta de trabalho usando um fluxo de memória contendo conteúdo HTML.
  2. Save the result as an Excel file.

O seguinte exemplo de código mostra como exportar uma string HTML para uma planilha do Excel:

from aspose.cells import Workbook, HtmlLoadOptions
from io import BytesIO

# Passo 1: Definir a string HTML
html_data = """
<table border='1'>
<tr><th>Product</th><th>Price</th><th>Quantity</th></tr>
<tr><td>Laptop</td><td>800</td><td>5</td></tr>
<tr><td>Phone</td><td>400</td><td>10</td></tr>
</table>
"""

# Passo 2: Converter string HTML em bytes
html_bytes = BytesIO(html_data.encode('utf-8'))

# Passo 3: Carregar HTML da memória
options = HtmlLoadOptions()
workbook = Workbook(html_bytes, options)

# Passo 4: Salvar como Excel
workbook.save("from_string.xlsx")
Converter String HTML para Excel usando Python

Converter String HTML para Excel usando Python.

Opções Avançadas para Conversão de HTML para Excel

Aspose.Cells fornece controle avançado sobre como seus arquivos HTML são lidos e salvos. Você pode usar a classe HtmlLoadOptions para lidar com imagens incorporadas, formatação ou codificação.

Siga os passos abaixo para personalizar o carregamento de arquivos HTML:

  1. Crie uma instância da classe HtmlLoadOptions.
  2. Especifique as opções de carregamento HTML.
  3. Carregue HTML com opções usando a classe Workbook.
  4. Salve como Excel usando o save() método.

O seguinte exemplo de código usa HtmlLoadOptions para manipular HTML com configurações específicas e salvar como um arquivo Excel.

from aspose.cells import Workbook, HtmlLoadOptions

# Passo 1: Definir opções de carregamento HTML
load_options = HtmlLoadOptions()
load_options.auto_fit_cols_and_rows = True  # Automatically adjusts columns and rows

# Passo 2: Carregar HTML com opções
workbook = Workbook("sample.html", load_options)

# Passo 3: Salvar como Excel
workbook.save("table_advanced.xlsx")
Converter HTML para Excel usando Python - Opções Avançadas

Opções Avançadas para Conversão de HTML para Excel.

Quando Usar Opções de Carregamento

Use essas opções quando:

  • Seu HTML inclui tabelas grandes ou células mescladas.
  • Você quer preservar a larguras e estilos das colunas.
  • Você precisa ajustar automaticamente o layout para melhor legibilidade.

Converter HTML para Vários Formatos Excel

Aspose.Cells permite salvar a saída em diferentes formatos de planilha com base em suas necessidades. Ele possibilita a integração em pipelines de dados, painéis ou ferramentas de automação que exigem diferentes formatos de exportação.

from aspose.cells import Workbook

workbook = Workbook("sample.html")

# Salvar em formato XLS
workbook.save("output.xls")

# Salvar no formato CSV
workbook.save("output.csv")

# Salvar como PDF para relatórios
workbook.save("output.pdf")

Obtenha uma Licença Gratuita

Avalie o Aspose.Cells for Python via .NET sem limitações. Solicite uma licença temporária gratuita na Aspose License Page.Aplique-a em seu código para explorar todos os recursos premium, desde o manuseio de arquivos grandes até formatação avançada e manipulação de gráficos.

Converter HTML para Excel Online

Se você deseja converter rapidamente seu conteúdo HTML em formato Excel sem escrever código, experimente o conversor online Aspose.Cells HTML to Excel online converter.

Conversor Online Gratuito de HTML para Excel
Input file
Output format
  

Este aplicativo web gratuito funciona diretamente em seu navegador e suporta múltiplos formatos, incluindo HTML, XLS, XLSX, CSV e ODS. Você pode enviar um arquivo, escolher o formato de saída e baixar o Excel convertido instantaneamente.

Python HTML to Excel: Recursos Gratuitos

Além de converter HTML para Excel, Aspose.Cells for Python via .NET suporta conversões de arquivos, geração de gráficos, fórmulas, formatação e tabelas dinâmicas. Os desenvolvedores podem usá-lo para criar ou processar arquivos do Excel sem o Microsoft Office. Utilize os seguintes recursos para explorar recursos mais avançados:

Conclusão

Converter HTML para Excel em Python é uma maneira poderosa de trazer dados baseados na web para o seu ambiente de análise ou relatórios. Com Aspose.Cells for Python, você pode realizar essa conversão com apenas algumas linhas de código, mantendo a precisão, formatação e desempenho. Seja você criando um script de processamento de dados ou integrando relatórios da web em dashboards do Excel, o Aspose.Cells oferece todas as ferramentas de que você precisa.

Tem uma pergunta ou precisa de ajuda técnica? Visite nosso Free Support Forum para se conectar diretamente com nossos especialistas. Nossa equipe está pronta para ajudá-lo a resolver problemas e orientá-lo em seu projeto.

Perguntas Frequentes (FAQs)

1. Posso converter HTML diretamente para Excel usando Python?

Sim. Você pode converter qualquer arquivo HTML ou string contendo dados de tabela diretamente para Excel usando a biblioteca Aspose.Cells for Python via .NET. Ela lê a estrutura HTML e preserva tabelas, formatação e estilos no arquivo Excel de saída.

2. O Aspose.Cells suporta a conversão de strings HTML em Excel?

Absolutamente. Você pode carregar conteúdo HTML de uma string ou fluxo de memória em vez de um arquivo. Isso é útil quando o HTML é gerado dinamicamente a partir de dados da web, APIs ou entrada do usuário.

3. Quais formatos de saída são suportados além do XLSX?

Além do XLSX, você pode exportar seu HTML para XLS, CSV, ODS, PDF e outros formatos suportados pelo Aspose.Cells. Você só precisa especificar o SaveFormat desejado ao salvar a pasta de trabalho.

4. Preciso ter o Microsoft Excel instalado para usar o Aspose.Cells?

Não. Aspose.Cells é uma biblioteca Python autônoma que não depende do Microsoft Excel ou Office. Você pode realizar todas as conversões programaticamente em qualquer sistema.

5. Existe uma ferramenta online para converter HTML em Excel sem codificação?

Sim, a Aspose oferece um conversor online gratuito HTML to Excel onde você pode enviar um arquivo HTML e baixar instantaneamente a saída em Excel.

6. O Aspose.Cells pode lidar com tabelas HTML grandes ou complexas?

Sim. Aspose.Cells é projetado para processamento de dados de alto desempenho. Ele lida eficientemente com grandes arquivos HTML contendo várias tabelas, imagens ou layouts complexos, garantindo uma saída precisa para o Excel.

See Also