עבודה עם קבצי CSV היא משימה יומית עבור מנתחי נתונים ומפתחים. אם אתה צריך להמיר CSV ל-Pandas DataFrame, Pandas מספקת פונקציה ישירה readcsv(), אבל לפעמים אתה צריך יותר כוח. כאן נכנס לתמונה Aspose.Cells עבור Python. עם Aspose.Cells, אתה יכול לייבא CSV ל-Pandas תוך הבטחת שליטה טובה יותר, אמינות ותאימות עם פורמטי Excel. בפוסט בבלוג הזה, תלמד שלב אחר שלב כיצד להמיר CSV ל-Pandas, לטפל בקבצי Excel, ולייצא אותם ל-Pandas DataFrames.

עד הסוף, תדעו מספר דרכים לעבור מ-CSV ל-DataFrame של פנדס במהירות וביעילות.

ספריית פייתון להמיר CSV ל-DataFrame של פנדה

Aspose.Cells for Python via .NET היא ספרייה חזקה לעבודה עם גיליונות אלקטרוניים. היא מאפשרת לך ליצור, לקרוא, לערוך ולהמיר קבצי Excel ו- CSV בצורה תוכנתית מבלי לדרוש את Microsoft Excel. כאשר אתה מתמודד עם המרות מ- CSV ל- Pandas, Aspose.Cells פועלת כגשר מהימן בין קבצי CSV גולמיים ל- DataFrames של Pandas עם מבנה.

דרישות מוקדמות

לפני הרצת הדוגמאות, ודא שיש לך את הדברים הבאים מותקנים:

pip install aspose-cells-python
  • Pandas – התקנה עם pip:
pip install pandas

הספריות הללו יאפשרו לך לטעון ולעבד קבצי CSV/Excel עם Aspose.Cells ולאחר מכן להמיר אותם ל-Pandas DataFrames לצורך ניתוח.

Aspose.Cells for Python via .NET → לקריאה ועיבוד קבצי CSV/Excel.

פנדות → לבניית וניתוח DataFrames.

למconvert CSV ל-Pandas DataFrame: שלב אחר שלב

בקטע הזה, תעבור על התהליך המלא של הפיכת קובץ CSV למסגרת נתונים של פנדס באמצעות Aspose.Cells עבור פייתון. כל שלב מחולק למשימות קטנות. זה מקל עליך לעקוב. תתחיל על ידי טעינת ה-CSV לתוך חוברת עבודה. תחלוץ את התכנים שלה ותבנה מסגרת נתונים של פנדס.

שלב 1: טען CSV לתוך חוברת עבודה

בואו נתחיל על ידי טעינת קובץ CSV לתוך חוברת עבודה של Aspose.Cells.

  1. ייבא את מחלקת Workbook.
  2. טען את קובץ ה-CSV.
  3. גש לגיליון הראשון.
import aspose.cells as ac

# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")

# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]

שלב 2: חילוץ נתונים מגיליון עבודה

ברגע שהקובץ הועלה, השקול את תוכנו שורה אחרי שורה. זה מכין את הנתונים להמרה ל- DataFrame.

  1. קבל את אוסף התאים.
  2. לולאה דרך שורות ועמודות.
  3. אחסן ערכים ברשימה של רשימות.
cells = csv_ws.cells

# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

שלב 3: המר CSV ל-Pandas DataFrame

עכשיו, המירו את הרשימה המוצאת למסגרת נתונים של פנדות. שלב זה מראה כיצד לעבור מקובץ CSV למסגרת נתונים של פנדות עם כותרות מתאימות.

  1. Import Pandas.
  2. שימוש בשורה הראשונה ככותרות.
  3. צור DataFrame משורות הנותרות.
import pandas as pd

# Convert to Pandas DataFrame
headers = data[0]   # First row as header
rows = data[1:]     # Remaining rows as data

df = pd.DataFrame(rows, columns=headers)

print(df.head())

אתה עכשיו המרת בהצלחה CSV ל- DataFrame של Pandas באמצעות Aspose.Cells.

עם הצעדים האלה, ראיתם כיצד להמיר קובץ CSV למסגרת נתונים של פנדס באמצעות Aspose.Cells. בהמשך, בואו נחקור כיצד לטפל בקובצי Excel על ידי שמירתם קודם לכן כ-CSV ולאחר מכן טוענים אותם לתוך פנדס.

להמיר Excel ל-DataFrame של פנדס דרך קובץ CSV

לפעמים הנתונים שלך בפורמט Excel (.xlsx או .xls) ואתה רוצה להמיר Excel ל- Pandas DataFrame דרך CSV. Aspose.Cells עושה את זה בצורה חלקה.

עקוב אחר הצעדים למטה כדי להמיר Excel ל-Pandas DataFrames באמצעות קובץ CSV:

  1. טען את קובץ ה-Excel לתוך אובייקט המעמד Workbook.
  2. שמור את קובץ האקסל כ- CSV.
  3. טען מחדש את קובץ ה-CSV שנוצר לאחרונה לתוך חוברת עבודה.
  4. גש לגיליון הראשון באמצעות האינדקס שלו.
  5. Extract all cell values into a Python list של רשימות.
  6. השתמש בשורה הראשונה ככותרות עמודות ובשאר כשורות נתונים.
  7. צור DataFrame של Pandas מהנתונים שהופקו.
  8. Print the results.

דוגמת הקוד הבאה מראה כיצד להמיר קובץ Excel ל- DataFrame של pandas בפייתון:

import aspose.cells as ac
import pandas as pd

# טעון קובץ Excel
excel_wb = ac.Workbook("PandasTest.xlsx")

# שמור את Excel כ- CSV
excel_wb.save("converted.csv", ac.SaveFormat.CSV)

# טען מחדש CSV עם Aspose.Cells
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]

# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

# Convert to Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)

# Show results
print(df.head())
ממיר את Excel ל-Pandas DataFrame דרך CSV

דוגמת קובץ Excel להמרה ל- Pandas DataFrame באמצעות CSV.

Output

   Product A  Product B Period
0         50        160     Q1
1        100         32     Q2
2        170         50     Q3
3        300         40     Q4

עבודה עם קבצי CSV גדולים

עבור סטים מאוד גדולים של נתונים, Aspose.Cells מטפל בזיכרון טוב יותר מאשר Pandas רגיל. אתה אפילו יכול להפעיל אופטימיזציה של זיכרון. עקוב אחרי אותם צעדים כמו לפני כן. השינוי היחיד הוא לטעון את קובץ ה-CSV עם LoadOptions ולקבוע את MEMORYPREFERENCE כדי לנהל קבצים גדולים ביעילות.

הדוגמה הבאה של קוד מראה כיצד להמיר קובץ CSV גדול ל- DataFrame של pandas ב-Python:

import aspose.cells as ac
import pandas as pd

# טען את קובץ ה-CSV הגדול עם Aspose.Cells
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]

# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

# Convert to Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)

# הצג תוצאות
print(df.head())

זה עושה את ייבוא ה-CSV ב-Pandas ליותר יעיל בצינורות נתונים.

קבל רישיון בחינם

נסה את Aspose.Cells עבור פייתון היום כדי לשפר את ההמרות שלך מ- CSV ל- Pandas DataFrame. Download את הגירסה החינמית או get a temporary license כדי לחקור את כל היכולות ללא מגבלות.

CSV to DF: משאבים נוספים חינמיים

אתה יכול להשתמש במשאבים למטה כדי לחקור יותר על ייבוא CSV, המרת DataFrame, ותכונות נוספות לעיבוד Excel ו-CSV הזמינות ב-Aspose.Cells עבור Python.

סיכום

במדריך זה, למדת כיצד לטעון קבצי CSV ישירות לתוך Aspose.Cells ולהמיר אותם ל-Pandas DataFrames, וכן כיצד לשמור קבצי Excel כ-CSV לפני ייבואם. יחד עם Pandas, Aspose.Cells נותן לך שליטה רבה יותר, ביצועים וגמישות, מה שהופך את משימות עיבוד הנתונים שלך לאמינות ולסקלאביליות יותר.

אם יש לך שאלות או זקוק לעזרה, אנא בקר בפורום התמיכה free support forum שלנו. צוות התמיכה שלנו זמין כדי לעזור לך.

ראה גם