קבצי Excel נשארים אחד מהפורמטים הפופולריים ביותר לניהול נתונים מבנים. ב-Python, ה-DataFrame של pandas הוא המבנה המועדף על מנת לארגן ולנתח את הנתונים ביעילות. לאחר שהנתונים מ-Excel מומר למבנה DataFrame, ניתן לשלב אותם בצורה חלקה עם מסדי נתונים, APIs, או מודלים של למידת מכונה לניתוח מעמיק ותובנות. במאמר זה, נחקור דרכים מעשיות להמיר Excel ל-DataFrames של pandas עם דוגמאות ברורות שיעזרו לך להתחיל.

What is a Pandas DataFrame?

DataFrame הוא מבנה נתונים דו-ממדית שסופק על ידי ספריית pandas. הוא נראה דומה לגיליון אלקטרוני של Excel עם שורות ועמודות. כל עמודה יכולה להחזיק סוגי נתונים שונים, כגון מחרוזות, מספרים שלמים או מספרים עשרוניים.

DataFrames הם אידיאליים עבור:

  • ייבוא וניקוי נתונים.
  • ביצוע פעולות מתמטיות.
  • סינון, קבוצות, ואגרגציה של נתונים.
  • מייצוא תוצאות ל-Excel, CSV או למסדי נתונים.

כשאתה ממיר קבצי Excel ל-DataFrames, אתה יכול מיד להחיל פעולות פנדס חזקות לניתוח.

ספריית Python להמרת Excel ל-DataFrame של Pandas

Aspose.Cells for Python via .NET נחשבת לעיתים קרובות ל הספריה הטובה ביותר לאקסל בפייתון עבור מפתחים שזקוקים ליותר מאשר טיפול בסיסי בגיליון אלקטרוני. היא מאפשרת לך ליצור, לקרוא, לערוך ולהמיר קבצי אקסל בצורה מתוכנתת دون התקנה של Microsoft Excel.

למטרות המרה של DataFrame, הספרייה הזו זוהרת מכיוון שהיא תומכת לחלוטין בתכונות מתקדמות של Excel כגון נוסחאות, תאים מאוחדים, גרפים, עמודות ציר, ועיצוב מותנה. היא פועלת עם מספר פורמטים, כולל XLS, XLSX, XLSB, ODS, CSV, ו- JSON.

כאשר אתה משתמש ב-Aspose.Cells כדי להעביר נתוני Excel ל-pandas, אתה מקבל המרה חלקה ל-DataFrames עם דיוק גבוה. זה אומר ששלדת ה-Excel, העיצוב והערכים שלך נשארים מדויקים, בעוד שפנדות נותנות לך את הכלים לנתח ולשנות את הנתונים ביעילות.

Convert Excel to Pandas DataFrame

אתה יכול ליצור גיליון אלקטרוני חדש, ליצור נתונים בצורה תכנותית, ולתרגם את Excel ל- pandas DataFrame ב-Python. זה נותן לך שליטה מלאה על המבנה של הקובץ תוך כדי הכנתו לניתוח מיידי ב-pandas.

עקוב אחר הצעדים למטה כדי להמיר Excel ל- Pandas DataFrame:

  1. צור מופע של מחלקת ה- Workbook.
  2. גשת לגיליון הראשון ולתאים שלו.
  3. הוסף ערכים לתאי הגיליון.
  4. Extract rows and headers.
  5. תמיר את הנתונים המוצאים ל- pandas DataFrame.

הדוגמה הקודמת ב-Python מדגימה כיצד להמיר Excel ל- DataFrame של pandas:

import pandas as pd
from aspose.cells import Workbook

# צעד 1: צור חוברת עבודה חדשה של Excel באמצעות Aspose.Cells
wb = Workbook()

# שלב 2: גישה לגיליון העבודה הראשון
ws = wb.worksheets.get(0)

# שלב 3: גש לאוסף התאים של גיליון העבודה
c = ws.cells

# שלב 4: הוסף נתוני דוגמה לגיליון העבודה
c.get("A1").value, c.get("B1").value, c.get("C1").value = "Name", "Age", "City"
c.get("A2").value, c.get("B2").value, c.get("C2").value = "Alice", 25, "New York"
c.get("A3").value, c.get("B3").value, c.get("C3").value = "Bob", 30, "San Francisco"
c.get("A4").value, c.get("B4").value, c.get("C4").value = "Charlie", 35, "Los Angeles"

# שלב 5: לקטוף כותרת מהשורה הראשונה של הנתונים
header_idx = c.min_data_row
columns = [cell.value for cell in c.rows[header_idx]]

# שלב 6: אסוף את השורות הנותרות כנתונים
data = [
    [cell.value for cell in row]
   for idx, row in enumerate(c.rows)
    if row and idx != header_idx
]

# שלב 7: בנה DataFrame במכה אחת
df = pd.DataFrame(data, columns=columns)
print(df)

Output

      Name  Age           City
0    Alice   25       New York
1      Bob   30  San Francisco
2  Charlie   35    Los Angeles

המירו קובץ Excel קיים ל-Pandas DataFrame

אם כבר יש לך קובץ Excel, תוכל לטעון אותו ולהמיר את Excel ל- pandas DataFrame בפייתון ישירות. זה מאפשר לך לשמור על מבנה הגיליון המקורי תוך כדי עבודה עם הנתונים בצורה יעילה יותר ב- pandas.

עקוב אחר השלבים למטה כדי לטעון ולהמיר קובץ Excel קיים למסגרת נתונים של פנדס:

  1. פתח קובץ Excel קיים utilizando la Workbook class.
  2. בחר גיליון עבודה לפי שם או אינדקס.
  3. קרא את כל השורות והעמודות.
  4. Extract headers if available.
  5. המיר את התוצאה ל- DataFrame של פנדס.

הקוד הבא ב-Python מראה כיצד להמיר קובץ Excel קיים לדאטה פריים של pandas:

import pandas as pd
from aspose.cells import Workbook

# שלב 1: טען את חוברת העבודה של Excel מקובץ
workbook = Workbook("PandasTest.xlsx")

# שלב 2: בחר את הגיליון (באינדקס או בשם)
worksheet = workbook.worksheets.get("Sheet1")  # or workbook.worksheets[0]

# צעדים 3: קבל את אוסף תאי הגיליון
cells = worksheet.cells

# שלב 4: חישוב מספר העמודות (הבדל אינדקס מבוסס 0)
col_count = cells.max_data_column - cells.min_data_column

# שלב 5: צור רשימה לאחסון נתוני השורות
output_data = []

# שלב 6: מצא את המיקום של השורה הראשונה שמכילה נתונים
first_data_row_index = cells.min_data_row

# שלב 7: חזור על כל השורות בגיליון
for row in cells.rows:
    if row is None:
        continue  # Skip uninitialized rows

    # אסוף את כל ערכי התאים עבור השורה הנוכחית
    row_data = [cell.value for cell in row]
    output_data.append(row_data)

# שַׁבָּט 8: הכן כותרות עמודות
columns = []
if True:  # Use header row
    row = cells.rows[first_data_row_index]
   for cell in row:
        columns.append(cell.value)
    # הסר שורת כותרת מהנתונים
    output_data = output_data[1:]
else:
    # אם אין כותרת, הקAssign שמות ברירת מחדל לעמודות.
    columns = [f"Unnamed: {i}" for i in range(col_count + 1)]

# שלב 9: המרה של הנתונים למסגרת נתונים של פנדס
df = pd.DataFrame(output_data, columns=columns)

# שלב 10: הדפס את ה-DataFrame
print(df)
ממיר קובץ Excel קיים ל-Pandas DataFrame

דוגמה לקובץ Excel להמרה ל- Pandas DataFrame.

Output

   Product A  Product B Period
0         50        160     Q1
1        100         32     Q2
2        170         50     Q3
3        300         40     Q4

המרת Excel ל-Pandas באמצעות JSON

ייצאו את הטווח שלכם ב-Excel ל-JSON עם JsonUtility.exportrangetojson, ואז טען אותו ל-Pandas. ראה את המדריך צעד אחר צעד: Convert Excel to Pandas DataFrame via JSON.

המרה של Excel ל-Pandas דרך CSV

המר את קובץ ה-Excel שלך לקובץ CSV ואז טען אותו לפנדה. עקוב אחרי המדריך שלב אחרי שלב: Convert Excel to Pandas DataFrame via CSV.

קבל רישיון חינם

אתה יכול לנסות את כל הפיצ’רים של Aspose.Cells עבור Python באמצעות .NET ללא כל מגבלות על ידי שימוש ברישיון זמני חינם. אנא בקר בדף ה- license page והשג רישיון חינם. זה מאפשר לך להעריך את ה-API המלא, כולל המרות מתקדמות של Excel ל-DataFrame.

משאבים נוספים בחינם

חקור עוד דרכים לעבוד עם קבצי Excel ב-Python דרך המשאבים הללו, אשר יעזרו לך לעבור מעבר להמרות בסיסיות וליישם את Aspose.Cells ביעילות בפרויקטים אמיתיים.

סיכום

המרת קבצי Excel ל- DataFrames של pandas הופכת פשוטה ואמינה עם Aspose.Cells עבור Python דרך .NET. אם אתם בונים גיליונות אלקטרוניים חדשים או מייבאים קיימים, הספרייה מבטיחה העברת נתונים באיכות גבוהה ותמיכה מלאה בפורמטים. על ידי שילוב הגמישות של pandas עם הטיפול המתקדם של Excel של Aspose.Cells, תוכלו לפשט את עיבוד הנתונים ולפתוח ניתוחים עוצמתיים ב-Python.

אם יש לך שאלות, בקר בפורום התמיכה שלנו free support forum, והצוות שלנו יהיה שמח לסייע לך.

ראה גם