Lavorare con file CSV è un compito quotidiano per analisti dei dati e sviluppatori. Se hai bisogno di convertire CSV in DataFrame Pandas, Pandas fornisce una funzione readcsv() diretta, ma a volte hai bisogno di più potenza. Qui entra in gioco Aspose.Cells for Python. Con Aspose.Cells, puoi importare CSV in Pandas garantendo un migliore controllo, affidabilità e compatibilità con i formati Excel. In questo post del blog, imparerai passo dopo passo come convertire CSV in Pandas, gestire file Excel ed esportarli in DataFrame Pandas.
Entro la fine, saprai diversi modi per passare da CSV a DataFrame Pandas in modo rapido ed efficiente.
Libreria Python per convertire CSV in DataFrame Pandas
Aspose.Cells for Python tramite .NET è una potente libreria per lavorare con fogli di calcolo. Ti consente di creare, leggere, modificare e convertire file Excel e CSV programmaticamente senza richiedere Microsoft Excel. Quando si tratta di conversioni da CSV a Pandas, Aspose.Cells funge da ponte affidabile tra i file CSV grezzi e i DataFrame Pandas strutturati.
Prerequisites
Prima di eseguire gli esempi, assicurati di avere installato quanto segue:
- Aspose.Cells for Python tramite .NET: Scarica dalle versioni o installa con pip:
pip install aspose-cells-python
- Pandas – installare con pip:
pip install pandas
Queste due librerie ti permetteranno di caricare e processare file CSV/Excel con Aspose.Cells e poi convertirli in DataFrame Pandas per l’analisi.
Aspose.Cells for Python via .NET → per la lettura e l’elaborazione di file CSV/Excel.
Pandas → per costruire e analizzare DataFrames.
Convertire CSV in DataFrame di Pandas: Passo dopo Passo
In questa sezione, camminerai attraverso l’intero processo di trasformazione di un file CSV in un DataFrame Pandas utilizzando Aspose.Cells for Python. Ogni passaggio è diviso in piccoli compiti. Questo ti rende facile seguire. Inizierai caricando il CSV in un workbook. Estrai i suoi contenuti e costruisci un DataFrame Pandas.
Passo 1: Carica il CSV nel Workbook
Iniziamo caricando un file CSV in un workbook Aspose.Cells.
- Importa la classe Workbook.
- Carica il file CSV.
- Accedi al primo foglio di lavoro.
import aspose.cells as ac
# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")
# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]
Passaggio 2: Estrarre dati dal foglio di lavoro
Una volta caricato il file, estrai il suo contenuto riga per riga. Questo prepara i dati per la conversione in un DataFrame.
- Prendi la collezione di celle.
- Scorri attraverso righe e colonne.
- Memorizza i valori in un elenco di elenchi.
cells = csv_ws.cells
# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
Passaggio 3: Converti CSV in DataFrame Pandas
Ora, converti l’elenco estratto in un DataFrame di Pandas. Questo passaggio mostra come passare da CSV a DataFrame di Pandas con intestazioni corrette.
- Importa Pandas.
- Usa la prima riga come intestazioni.
- Crea un DataFrame dalle righe rimanenti.
import pandas as pd
# Convert to Pandas DataFrame
headers = data[0] # First row as header
rows = data[1:] # Remaining rows as data
df = pd.DataFrame(rows, columns=headers)
print(df.head())
Hai ora convertito con successo CSV in DataFrame Pandas utilizzando Aspose.Cells.
Con questi passaggi, hai visto come convertire un file CSV in un DataFrame di Pandas utilizzando Aspose.Cells. Successivamente, esploriamo come gestire i file Excel salvandoli prima come CSV e poi caricandoli in Pandas.
Convertire Excel in DataFrame Pandas tramite file CSV
A volte i tuoi dati sono in formato Excel (.xlsx o .xls) e vuoi convertire Excel in Pandas DataFrame tramite CSV. Aspose.Cells rende tutto questo semplice.
Segui i passaggi seguenti per convertire Excel in DataFrame Pandas tramite file CSV:
- Carica il file Excel nell’oggetto della classe
Workbook. - Salva il file Excel come CSV.
- Ricarica il file CSV appena creato in un foglio di lavoro.
- Accedi al primo foglio di lavoro utilizzando il suo indice.
- Estrai tutti i valori delle celle in una lista di liste Python.
- Usa la prima riga come intestazioni di colonna e il resto come righe di dati.
- Crea un DataFrame Pandas dai dati estratti.
- Print the results.
L’esempio di codice seguente mostra come convertire Excel in un DataFrame pandas in Python:
import aspose.cells as ac
import pandas as pd
# Carica un file Excel
excel_wb = ac.Workbook("PandasTest.xlsx")
# Salva Excel come CSV
excel_wb.save("converted.csv", ac.SaveFormat.CSV)
# Ricarica CSV con Aspose.Cells
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]
# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# Convertire in un DataFrame Pandas
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())

File Excel di esempio per la conversione in un DataFrame Pandas tramite CSV.
Output
Product A Product B Period
0 50 160 Q1
1 100 32 Q2
2 170 50 Q3
3 300 40 Q4
Lavorare con file CSV di grandi dimensioni
Per set di dati molto grandi, Aspose.Cells gestisce la memoria meglio rispetto a Pandas semplice. Puoi anche abilitare l’ottimizzazione della memoria. Segui gli stessi passaggi di prima. L’unica modifica è caricare il file CSV con LoadOptions e impostare MEMORYPREFERENCE per gestire grandi file in modo efficiente.
Il seguente esempio di codice mostra come convertire un grande file CSV in un DataFrame di pandas in Python:
import aspose.cells as ac
import pandas as pd
# Carica il grande file CSV con Aspose.Cells
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]
# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# Convertire in DataFrame Pandas
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())
Questo rende l’importazione di CSV in Pandas più efficiente nei pipeline di dati.
Ottieni una Licenza Gratuita
Prova Aspose.Cells for Python oggi per migliorare le tue conversioni da CSV a DataFrame Pandas. Download la prova gratuita o get a temporary license per esplorare tutte le funzionalità senza limitazioni.
CSV a DF: Risorse Aggiuntive Gratuite
Puoi utilizzare le risorse qui sotto per esplorare di più sull’importazione di CSV, la conversione di DataFrame e altre funzionalità di elaborazione di Excel e CSV disponibili in Aspose.Cells for Python.
Conclusione
In this guide, you learned how to load CSV files directly into Aspose.Cells and convert them into Pandas DataFrames, as well as how to save Excel files as CSV before importing them. Together with Pandas, Aspose.Cells gives you greater control, performance, and flexibility, making your data processing tasks more reliable and scalable.
Se hai domande o hai bisogno di assistenza, visita il nostro forum di supporto gratuito.Il nostro team di supporto è disponibile per aiutarti.
