Lavorare con file CSV è un compito quotidiano per analisti dei dati e sviluppatori. Se hai bisogno di convertire CSV in DataFrame Pandas, Pandas fornisce una funzione readcsv() diretta, ma a volte hai bisogno di più potenza. Qui entra in gioco Aspose.Cells for Python. Con Aspose.Cells, puoi importare CSV in Pandas garantendo un migliore controllo, affidabilità e compatibilità con i formati Excel. In questo post del blog, imparerai passo dopo passo come convertire CSV in Pandas, gestire file Excel ed esportarli in DataFrame Pandas.

Entro la fine, saprai diversi modi per passare da CSV a DataFrame Pandas in modo rapido ed efficiente.

Libreria Python per convertire CSV in DataFrame Pandas

Aspose.Cells for Python tramite .NET è una potente libreria per lavorare con fogli di calcolo. Ti consente di creare, leggere, modificare e convertire file Excel e CSV programmaticamente senza richiedere Microsoft Excel. Quando si tratta di conversioni da CSV a Pandas, Aspose.Cells funge da ponte affidabile tra i file CSV grezzi e i DataFrame Pandas strutturati.

Prerequisites

Prima di eseguire gli esempi, assicurati di avere installato quanto segue:

pip install aspose-cells-python
  • Pandas – installare con pip:
pip install pandas

Queste due librerie ti permetteranno di caricare e processare file CSV/Excel con Aspose.Cells e poi convertirli in DataFrame Pandas per l’analisi.

Aspose.Cells for Python via .NET → per la lettura e l’elaborazione di file CSV/Excel.

Pandas → per costruire e analizzare DataFrames.

Convertire CSV in DataFrame di Pandas: Passo dopo Passo

In questa sezione, camminerai attraverso l’intero processo di trasformazione di un file CSV in un DataFrame Pandas utilizzando Aspose.Cells for Python. Ogni passaggio è diviso in piccoli compiti. Questo ti rende facile seguire. Inizierai caricando il CSV in un workbook. Estrai i suoi contenuti e costruisci un DataFrame Pandas.

Passo 1: Carica il CSV nel Workbook

Iniziamo caricando un file CSV in un workbook Aspose.Cells.

  1. Importa la classe Workbook.
  2. Carica il file CSV.
  3. Accedi al primo foglio di lavoro.
import aspose.cells as ac

# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")

# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]

Passaggio 2: Estrarre dati dal foglio di lavoro

Una volta caricato il file, estrai il suo contenuto riga per riga. Questo prepara i dati per la conversione in un DataFrame.

  1. Prendi la collezione di celle.
  2. Scorri attraverso righe e colonne.
  3. Memorizza i valori in un elenco di elenchi.
cells = csv_ws.cells

# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

Passaggio 3: Converti CSV in DataFrame Pandas

Ora, converti l’elenco estratto in un DataFrame di Pandas. Questo passaggio mostra come passare da CSV a DataFrame di Pandas con intestazioni corrette.

  1. Importa Pandas.
  2. Usa la prima riga come intestazioni.
  3. Crea un DataFrame dalle righe rimanenti.
import pandas as pd

# Convert to Pandas DataFrame
headers = data[0]   # First row as header
rows = data[1:]     # Remaining rows as data

df = pd.DataFrame(rows, columns=headers)

print(df.head())

Hai ora convertito con successo CSV in DataFrame Pandas utilizzando Aspose.Cells.

Con questi passaggi, hai visto come convertire un file CSV in un DataFrame di Pandas utilizzando Aspose.Cells. Successivamente, esploriamo come gestire i file Excel salvandoli prima come CSV e poi caricandoli in Pandas.

Convertire Excel in DataFrame Pandas tramite file CSV

A volte i tuoi dati sono in formato Excel (.xlsx o .xls) e vuoi convertire Excel in Pandas DataFrame tramite CSV. Aspose.Cells rende tutto questo semplice.

Segui i passaggi seguenti per convertire Excel in DataFrame Pandas tramite file CSV:

  1. Carica il file Excel nell’oggetto della classe Workbook.
  2. Salva il file Excel come CSV.
  3. Ricarica il file CSV appena creato in un foglio di lavoro.
  4. Accedi al primo foglio di lavoro utilizzando il suo indice.
  5. Estrai tutti i valori delle celle in una lista di liste Python.
  6. Usa la prima riga come intestazioni di colonna e il resto come righe di dati.
  7. Crea un DataFrame Pandas dai dati estratti.
  8. Print the results.

L’esempio di codice seguente mostra come convertire Excel in un DataFrame pandas in Python:

import aspose.cells as ac
import pandas as pd

# Carica un file Excel
excel_wb = ac.Workbook("PandasTest.xlsx")

# Salva Excel come CSV
excel_wb.save("converted.csv", ac.SaveFormat.CSV)

# Ricarica CSV con Aspose.Cells
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]

# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

# Convertire in un DataFrame Pandas
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)

# Show results
print(df.head())
Convertire Excel in un DataFrame Pandas tramite CSV

File Excel di esempio per la conversione in un DataFrame Pandas tramite CSV.

Output

   Product A  Product B Period
0         50        160     Q1
1        100         32     Q2
2        170         50     Q3
3        300         40     Q4

Lavorare con file CSV di grandi dimensioni

Per set di dati molto grandi, Aspose.Cells gestisce la memoria meglio rispetto a Pandas semplice. Puoi anche abilitare l’ottimizzazione della memoria. Segui gli stessi passaggi di prima. L’unica modifica è caricare il file CSV con LoadOptions e impostare MEMORYPREFERENCE per gestire grandi file in modo efficiente.

Il seguente esempio di codice mostra come convertire un grande file CSV in un DataFrame di pandas in Python:

import aspose.cells as ac
import pandas as pd

# Carica il grande file CSV con Aspose.Cells
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]

# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

# Convertire in DataFrame Pandas
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)

# Show results
print(df.head())

Questo rende l’importazione di CSV in Pandas più efficiente nei pipeline di dati.

Ottieni una Licenza Gratuita

Prova Aspose.Cells for Python oggi per migliorare le tue conversioni da CSV a DataFrame Pandas. Download la prova gratuita o get a temporary license per esplorare tutte le funzionalità senza limitazioni.

CSV a DF: Risorse Aggiuntive Gratuite

Puoi utilizzare le risorse qui sotto per esplorare di più sull’importazione di CSV, la conversione di DataFrame e altre funzionalità di elaborazione di Excel e CSV disponibili in Aspose.Cells for Python.

Conclusione

In this guide, you learned how to load CSV files directly into Aspose.Cells and convert them into Pandas DataFrames, as well as how to save Excel files as CSV before importing them. Together with Pandas, Aspose.Cells gives you greater control, performance, and flexibility, making your data processing tasks more reliable and scalable.

Se hai domande o hai bisogno di assistenza, visita il nostro forum di supporto gratuito.Il nostro team di supporto è disponibile per aiutarti.

See Also