I file Excel rimangono uno dei formati più popolari per gestire dati strutturati. In Python, il DataFrame di pandas è la struttura di riferimento per organizzare e analizzare quei dati in modo efficiente. Una volta convertiti in un DataFrame, i dati di Excel possono essere combinati senza problemi con database, API o modelli di apprendimento automatico per analisi e approfondimenti più approfonditi. In questo articolo, esploreremo modi pratici per convertire Excel in DataFrame di pandas con esempi chiari per aiutarti a iniziare.

What is a Pandas DataFrame?

Un DataFrame è una struttura dati 2D fornita dalla libreria pandas. Assomiglia a un foglio di calcolo Excel con righe e colonne. Ogni colonna può contenere diversi tipi di dati, come stringhe, interi o numeri decimali.

I DataFrame sono ideali per:

  • Importare e pulire i dati.
  • Eseguire operazioni matematiche.
  • Filtrare, raggruppare e aggregare i dati.
  • Esportazione dei risultati in Excel, CSV o database.

Quando converti i file Excel in DataFrame, puoi immediatamente applicare potenti operazioni pandas per l’analisi.

Libreria Python per Convertire Excel in DataFrame Pandas

Aspose.Cells for Python tramite .NET è spesso considerata la migliore libreria Python Excel per gli sviluppatori che necessitano di più della semplice gestione di fogli di calcolo. Ti permette di creare, leggere, modificare e convertire file Excel programmaticamente senza installare Microsoft Excel.

Per le conversioni di DataFrame, questa libreria brilla perché supporta completamente funzionalità avanzate di Excel come formule, celle unite, grafici, tabelle pivot e formattazione condizionale. Funziona con più formati, inclusi XLS, XLSX, XLSB, ODS, CSV e JSON.

Quando si utilizza Aspose.Cells per portare i dati di Excel in pandas, si ottiene una conversione fluida in DataFrame con alta fedeltà. Ciò significa che la struttura, la formattazione e i valori di Excel rimangono accurati, mentre pandas offre gli strumenti per analizzare e trasformare quei dati in modo efficiente.

Convertire Excel in DataFrame Pandas

Puoi creare un nuovo foglio di calcolo, generare dati programmaticamente e convertire Excel in un DataFrame pandas in Python. Questo ti consente di avere il pieno controllo sulla struttura del file rendendolo pronto per un’analisi immediata in pandas.

Segui i passaggi seguenti per convertire Excel in un DataFrame Pandas:

  1. Crea un’istanza della classe Workbook.
  2. Accedi al primo foglio di lavoro e alle sue celle.
  3. Aggiungi valori alle celle del foglio di lavoro.
  4. Extract rows and headers.
  5. Convert the extracted data into a pandas DataFrame.

Il seguente esempio di codice Python dimostra come convertire Excel in un DataFrame pandas:

import pandas as pd
from aspose.cells import Workbook

# Passo 1: Crea un nuovo workbook Excel utilizzando Aspose.Cells
wb = Workbook()

# Passaggio 2: Accedi al primo foglio di lavoro
ws = wb.worksheets.get(0)

# Step 3: Accedi alla collezione di celle del foglio di lavoro
c = ws.cells

# Passo 4: Aggiungi dati di esempio al foglio di lavoro
c.get("A1").value, c.get("B1").value, c.get("C1").value = "Name", "Age", "City"
c.get("A2").value, c.get("B2").value, c.get("C2").value = "Alice", 25, "New York"
c.get("A3").value, c.get("B3").value, c.get("C3").value = "Bob", 30, "San Francisco"
c.get("A4").value, c.get("B4").value, c.get("C4").value = "Charlie", 35, "Los Angeles"

# Passo 5: Prendi l'intestazione dalla prima riga di dati
header_idx = c.min_data_row
columns = [cell.value for cell in c.rows[header_idx]]

# Passo 6: Raccogli le righe rimanenti come dati
data = [
    [cell.value for cell in row]
   for idx, row in enumerate(c.rows)
    if row and idx != header_idx
]

# Step 7: Crea DataFrame in un colpo solo
df = pd.DataFrame(data, columns=columns)
print(df)

Output

      Name  Age           City
0    Alice   25       New York
1      Bob   30  San Francisco
2  Charlie   35    Los Angeles

Convertire un file Excel esistente in un DataFrame di Pandas

Se hai già un file Excel, puoi caricarlo e convertire Excel in un DataFrame pandas in Python direttamente. Questo ti consente di preservare la struttura originale del foglio mentre lavori con i dati in modo più efficiente in pandas.

Seguire i passaggi seguenti per caricare e convertire un file Excel esistente in un DataFrame Pandas:

  1. Apri un file Excel esistente utilizzando la classe Workbook.
  2. Seleziona un foglio di lavoro per nome o indice.
  3. Leggi tutte le righe e le colonne.
  4. Extract headers if available.
  5. Convert the result into a pandas DataFrame.

Il seguente codice Python mostra come convertire un file Excel esistente in un DataFrame pandas:

import pandas as pd
from aspose.cells import Workbook

# Passo 1: Carica il file Excel dal documento
workbook = Workbook("PandasTest.xlsx")

# Passo 2: Seleziona il foglio di lavoro (per indice o per nome)
worksheet = workbook.worksheets.get("Sheet1")  # or workbook.worksheets[0]

# Passaggio 3: Ottieni la collezione delle celle dal foglio di lavoro
cells = worksheet.cells

# Passo 4: Calcola il numero di colonne (differenza di indice a base zero)
col_count = cells.max_data_column - cells.min_data_column

# Passaggio 5: Crea un elenco per memorizzare i dati delle righe
output_data = []

# Passo 6: Trova l'indice della prima riga che contiene dati
first_data_row_index = cells.min_data_row

# Passaggio 7: Iterare attraverso tutte le righe nel foglio
for row in cells.rows:
    if row is None:
        continue  # Skip uninitialized rows

    # Raccogli tutti i valori delle celle per la riga corrente
    row_data = [cell.value for cell in row]
    output_data.append(row_data)

# Passaggio 8: Preparare le intestazioni delle colonne
columns = []
if True:  # Use header row
    row = cells.rows[first_data_row_index]
   for cell in row:
        columns.append(cell.value)
    # Rimuovi la riga dell'intestazione dai dati
    output_data = output_data[1:]
else:
    # Se non ci sono intestazioni, assegnare nomi di colonna predefiniti
    columns = [f"Unnamed: {i}" for i in range(col_count + 1)]

# Passo 9: Convertire i dati in un DataFrame pandas
df = pd.DataFrame(output_data, columns=columns)

# Passo 10: Stampa il DataFrame
print(df)
Convertire un file Excel esistente in un DataFrame di Pandas

Sample Excel file for converting into a Pandas DataFrame.

Output

   Product A  Product B Period
0         50        160     Q1
1        100         32     Q2
2        170         50     Q3
3        300         40     Q4

Convertire Excel in Pandas tramite JSON

Esporta il tuo intervallo Excel in JSON con JsonUtility.exportrangetojson, quindi caricalo in Pandas. Vedi la guida passo passo: Convert Excel to Pandas DataFrame via JSON.

Converti Excel in Pandas tramite CSV

Converti il tuo file Excel in CSV e poi caricalo in Pandas. Segui la guida passo passo: Convert Excel to Pandas DataFrame via CSV.

Ottieni una licenza gratuita

Puoi provare tutte le funzionalità di Aspose.Cells for Python tramite .NET senza limitazioni applicando una licenza temporanea gratuita. Visita la license page e ottieni una licenza gratuita. Questo ti consente di valutare l’intera API, comprese le conversioni avanzate da Excel a DataFrame.

Risorse gratuite aggiuntive

Esplora ulteriori modi per lavorare con i file Excel in Python attraverso queste risorse, che ti aiuteranno a superare le conversioni di base e ad applicare Aspose.Cells in modo efficace in progetti reali.

Conclusione

Convertire file Excel in DataFrame pandas diventa semplice e affidabile con Aspose.Cells for Python tramite .NET. Che tu stia creando nuovi fogli di calcolo o importando quelli esistenti, la libreria garantisce un trasferimento dei dati ad alta fedeltà e un supporto completo per i formati. Combinando la flessibilità di pandas con la gestione avanzata di Excel di Aspose.Cells, puoi semplificare l’elaborazione dei dati e sbloccare analisi potenti in Python.

Se hai domande, visita il nostro free support forum, e il nostro team sarà lieto di assisterti.

See Also