Trabalhar com arquivos CSV é uma tarefa diária para analistas de dados e desenvolvedores. Se você precisa converter CSV para Pandas DataFrame, o Pandas fornece uma função readcsv() direta, mas às vezes você precisa de mais poder. É aqui que o Aspose.Cells for Python entra. Com o Aspose.Cells, você pode importar CSV no Pandas, garantindo melhor controle, confiabilidade e compatibilidade com formatos do Excel. Neste post do blog, você aprenderá passo a passo como converter CSV para Pandas, lidar com arquivos do Excel e exportá-los para Pandas DataFrames.

Até o final, você conhecerá várias maneiras de ir de CSV para DataFrame Pandas de forma rápida e eficiente.

Biblioteca Python para Converter CSV em DataFrame do Pandas

Aspose.Cells for Python via .NET é uma poderosa biblioteca para trabalhar com planilhas. Ela permite que você crie, leia, edite e converta arquivos Excel e CSV programaticamente sem exigir o Microsoft Excel. Ao lidar com conversões de CSV para Pandas, Aspose.Cells atua como uma ponte confiável entre arquivos CSV brutos e DataFrames estruturados do Pandas.

Pré-requisitos

Antes de executar os exemplos, certifique-se de que você tenha o seguinte instalado:

pip install aspose-cells-python
  • Pandas – instalar com pip:
pip install pandas

Essas duas bibliotecas permitirão que você carregue e processe arquivos CSV/Excel com Aspose.Cells e, em seguida, os converta em DataFrames do Pandas para análise.

Aspose.Cells for Python via .NET → para leitura e processamento de arquivos CSV/Excel.

Pandas → para construir e analisar DataFrames.

Converter CSV para DataFrame do Pandas: Passo a Passo

Nesta seção, você irá percorrer todo o processo de transformar um arquivo CSV em um DataFrame do Pandas usando Aspose.Cells for Python. Cada etapa é dividida em pequenas tarefas. Isso facilita o seu acompanhamento. Você começará carregando o CSV em uma pasta de trabalho. Extraia seu conteúdo e construa um DataFrame do Pandas.

Passo 1: Carregar CSV na Pasta de Trabalho

Vamos começar carregando um arquivo CSV em uma pasta de trabalho Aspose.Cells.

  1. Importe a classe Workbook.
  2. Carregue o arquivo CSV.
  3. Acesse a primeira planilha.
import aspose.cells as ac

# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")

# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]

Passo 2: Extrair dados da planilha

Uma vez que o arquivo esteja carregado, extraia seu conteúdo linha por linha. Isso prepara os dados para conversão em um DataFrame.

  1. Obtenha a coleção de células.
  2. Percorra as linhas e colunas.
  3. Armazene valores em uma lista de listas.
cells = csv_ws.cells

# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

Passo 3: Converter CSV para DataFrame do Pandas

Agora, converta a lista extraída em um DataFrame do Pandas. Esta etapa mostra como ir de CSV para DataFrame do Pandas com cabeçalhos adequados.

  1. Importar Pandas.
  2. Use a primeira linha como cabeçalhos.
  3. Crie um DataFrame a partir das linhas restantes.
import pandas as pd

# Convert to Pandas DataFrame
headers = data[0]   # First row as header
rows = data[1:]     # Remaining rows as data

df = pd.DataFrame(rows, columns=headers)

print(df.head())

Você agora converteu com sucesso CSV para DataFrame Pandas usando Aspose.Cells.

Com estes passos, você viu como converter um arquivo CSV em um DataFrame do Pandas usando o Aspose.Cells. Em seguida, vamos explorar como lidar com arquivos do Excel, salvando-os primeiro como CSV e depois carregando-os no Pandas.

Converter Excel para DataFrame do Pandas através de arquivo CSV

Às vezes, seus dados estão em formato Excel (.xlsx ou .xls) e você deseja converter Excel para Pandas DataFrame via CSV. Aspose.Cells torna isso fácil.

Siga os passos abaixo para converter Excel em DataFrames do Pandas através de arquivo CSV:

  1. Carregue o arquivo Excel no objeto da classe Workbook.
  2. Salve o arquivo do Excel como um CSV.
  3. Recarregue o arquivo CSV recém-criado em uma pasta de trabalho.
  4. Acesse a primeira planilha pelo seu índice.
  5. Extrair todos os valores das células em uma lista de listas do Python.
  6. Use a primeira linha como cabeçalhos de coluna e o resto como linhas de dados.
  7. Crie um DataFrame do Pandas a partir dos dados extraídos.
  8. Print the results.

O seguinte exemplo de código mostra como converter Excel em um DataFrame do pandas em Python:

import aspose.cells as ac
import pandas as pd

# Carregue um arquivo Excel
excel_wb = ac.Workbook("PandasTest.xlsx")

# Salvar o Excel como CSV
excel_wb.save("converted.csv", ac.SaveFormat.CSV)

# Recarregar CSV com Aspose.Cells
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]

# Extrair dados de CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

# Convert to Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)

# Show results
print(df.head())
Converter Excel para um DataFrame Pandas via CSV

Arquivo Excel de exemplo para conversão em um DataFrame do Pandas via CSV.

Output

   Product A  Product B Period
0         50        160     Q1
1        100         32     Q2
2        170         50     Q3
3        300         40     Q4

Trabalhando com Grandes Arquivos CSV

Para conjuntos de dados muito grandes, Aspose.Cells lida com a memória melhor do que o Pandas puro. Você pode até habilitar a otimização da memória. Siga os mesmos passos de antes. A única mudança é carregar o arquivo CSV com LoadOptions e definir MEMORYPREFERENCE para lidar com arquivos grandes de forma eficiente.

O seguinte exemplo de código mostra como converter um grande arquivo CSV para um DataFrame do pandas em Python:

import aspose.cells as ac
import pandas as pd

# Carregue o grande arquivo CSV com Aspose.Cells
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]

# Extrair dados de CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

# Convert to Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)

# Show results
print(df.head())

Isso torna a importação de CSV no Pandas mais eficiente em pipelines de dados.

Obtenha uma Licença Gratuita

Experimente o Aspose.Cells for Python hoje para aprimorar suas conversões de CSV para DataFrame do Pandas. Download a versão de teste gratuita ou get a temporary license para explorar todas as capacidades sem limitações.

CSV para DF: Recursos Adicionais Gratuitos

Você pode usar os recursos abaixo para explorar mais sobre importação de CSV, conversão de DataFrame e outros recursos de processamento de Excel e CSV disponíveis no Aspose.Cells for Python.

Conclusão

Neste guia, você aprendeu como carregar arquivos CSV diretamente no Aspose.Cells e convertê-los em DataFrames do Pandas, bem como como salvar arquivos do Excel como CSV antes de importá-los. Juntamente com o Pandas, o Aspose.Cells oferece maior controle, desempenho e flexibilidade, tornando suas tarefas de processamento de dados mais confiáveis e escaláveis.

Se você tiver alguma dúvida ou precisar de assistência, visite nosso forum de suporte gratuito.Nossa equipe de suporte está disponível para ajudá-lo.

Veja também