Trabalhar com arquivos CSV é uma tarefa diária para analistas de dados e desenvolvedores. Se você precisa converter CSV para Pandas DataFrame, o Pandas fornece uma função readcsv() direta, mas às vezes você precisa de mais poder. É aqui que o Aspose.Cells for Python entra. Com o Aspose.Cells, você pode importar CSV no Pandas, garantindo melhor controle, confiabilidade e compatibilidade com formatos do Excel. Neste post do blog, você aprenderá passo a passo como converter CSV para Pandas, lidar com arquivos do Excel e exportá-los para Pandas DataFrames.
Até o final, você conhecerá várias maneiras de ir de CSV para DataFrame Pandas de forma rápida e eficiente.
Biblioteca Python para Converter CSV em DataFrame do Pandas
Aspose.Cells for Python via .NET é uma poderosa biblioteca para trabalhar com planilhas. Ela permite que você crie, leia, edite e converta arquivos Excel e CSV programaticamente sem exigir o Microsoft Excel. Ao lidar com conversões de CSV para Pandas, Aspose.Cells atua como uma ponte confiável entre arquivos CSV brutos e DataFrames estruturados do Pandas.
Pré-requisitos
Antes de executar os exemplos, certifique-se de que você tenha o seguinte instalado:
- Aspose.Cells for Python via .NET: Baixar do releases ou instalar com pip:
pip install aspose-cells-python
- Pandas – instalar com pip:
pip install pandas
Essas duas bibliotecas permitirão que você carregue e processe arquivos CSV/Excel com Aspose.Cells e, em seguida, os converta em DataFrames do Pandas para análise.
Aspose.Cells for Python via .NET → para leitura e processamento de arquivos CSV/Excel.
Pandas → para construir e analisar DataFrames.
Converter CSV para DataFrame do Pandas: Passo a Passo
Nesta seção, você irá percorrer todo o processo de transformar um arquivo CSV em um DataFrame do Pandas usando Aspose.Cells for Python. Cada etapa é dividida em pequenas tarefas. Isso facilita o seu acompanhamento. Você começará carregando o CSV em uma pasta de trabalho. Extraia seu conteúdo e construa um DataFrame do Pandas.
Passo 1: Carregar CSV na Pasta de Trabalho
Vamos começar carregando um arquivo CSV em uma pasta de trabalho Aspose.Cells.
- Importe a classe Workbook.
- Carregue o arquivo CSV.
- Acesse a primeira planilha.
import aspose.cells as ac
# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")
# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]
Passo 2: Extrair dados da planilha
Uma vez que o arquivo esteja carregado, extraia seu conteúdo linha por linha. Isso prepara os dados para conversão em um DataFrame.
- Obtenha a coleção de células.
- Percorra as linhas e colunas.
- Armazene valores em uma lista de listas.
cells = csv_ws.cells
# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
Passo 3: Converter CSV para DataFrame do Pandas
Agora, converta a lista extraída em um DataFrame do Pandas. Esta etapa mostra como ir de CSV para DataFrame do Pandas com cabeçalhos adequados.
- Importar Pandas.
- Use a primeira linha como cabeçalhos.
- Crie um DataFrame a partir das linhas restantes.
import pandas as pd
# Convert to Pandas DataFrame
headers = data[0] # First row as header
rows = data[1:] # Remaining rows as data
df = pd.DataFrame(rows, columns=headers)
print(df.head())
Você agora converteu com sucesso CSV para DataFrame Pandas usando Aspose.Cells.
Com estes passos, você viu como converter um arquivo CSV em um DataFrame do Pandas usando o Aspose.Cells. Em seguida, vamos explorar como lidar com arquivos do Excel, salvando-os primeiro como CSV e depois carregando-os no Pandas.
Converter Excel para DataFrame do Pandas através de arquivo CSV
Às vezes, seus dados estão em formato Excel (.xlsx ou .xls) e você deseja converter Excel para Pandas DataFrame via CSV. Aspose.Cells torna isso fácil.
Siga os passos abaixo para converter Excel em DataFrames do Pandas através de arquivo CSV:
- Carregue o arquivo Excel no objeto da classe
Workbook. - Salve o arquivo do Excel como um CSV.
- Recarregue o arquivo CSV recém-criado em uma pasta de trabalho.
- Acesse a primeira planilha pelo seu índice.
- Extrair todos os valores das células em uma lista de listas do Python.
- Use a primeira linha como cabeçalhos de coluna e o resto como linhas de dados.
- Crie um DataFrame do Pandas a partir dos dados extraídos.
- Print the results.
O seguinte exemplo de código mostra como converter Excel em um DataFrame do pandas em Python:
import aspose.cells as ac
import pandas as pd
# Carregue um arquivo Excel
excel_wb = ac.Workbook("PandasTest.xlsx")
# Salvar o Excel como CSV
excel_wb.save("converted.csv", ac.SaveFormat.CSV)
# Recarregar CSV com Aspose.Cells
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]
# Extrair dados de CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# Convert to Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())

Arquivo Excel de exemplo para conversão em um DataFrame do Pandas via CSV.
Output
Product A Product B Period
0 50 160 Q1
1 100 32 Q2
2 170 50 Q3
3 300 40 Q4
Trabalhando com Grandes Arquivos CSV
Para conjuntos de dados muito grandes, Aspose.Cells lida com a memória melhor do que o Pandas puro. Você pode até habilitar a otimização da memória. Siga os mesmos passos de antes. A única mudança é carregar o arquivo CSV com LoadOptions e definir MEMORYPREFERENCE para lidar com arquivos grandes de forma eficiente.
O seguinte exemplo de código mostra como converter um grande arquivo CSV para um DataFrame do pandas em Python:
import aspose.cells as ac
import pandas as pd
# Carregue o grande arquivo CSV com Aspose.Cells
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]
# Extrair dados de CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# Convert to Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())
Isso torna a importação de CSV no Pandas mais eficiente em pipelines de dados.
Obtenha uma Licença Gratuita
Experimente o Aspose.Cells for Python hoje para aprimorar suas conversões de CSV para DataFrame do Pandas. Download a versão de teste gratuita ou get a temporary license para explorar todas as capacidades sem limitações.
CSV para DF: Recursos Adicionais Gratuitos
Você pode usar os recursos abaixo para explorar mais sobre importação de CSV, conversão de DataFrame e outros recursos de processamento de Excel e CSV disponíveis no Aspose.Cells for Python.
Conclusão
Neste guia, você aprendeu como carregar arquivos CSV diretamente no Aspose.Cells e convertê-los em DataFrames do Pandas, bem como como salvar arquivos do Excel como CSV antes de importá-los. Juntamente com o Pandas, o Aspose.Cells oferece maior controle, desempenho e flexibilidade, tornando suas tarefas de processamento de dados mais confiáveis e escaláveis.
Se você tiver alguma dúvida ou precisar de assistência, visite nosso forum de suporte gratuito.Nossa equipe de suporte está disponível para ajudá-lo.
