فایل‌های اکسل همچنان یکی از محبوب‌ترین فرمت‌ها برای مدیریت داده‌های ساختاریافته هستند. در پایتون، DataFrame کتابخانه pandas ساختار اصلی برای سازماندهی و تحلیل کارآمد آن داده‌ها است. پس از تبدیل به یک DataFrame، داده‌های اکسل می‌توانند به راحتی با پایگاه‌های داده، APIها، یا مدل‌های یادگیری ماشین ترکیب شوند تا تحلیل و بینش‌های عمیق‌تری را فراهم کنند. در این مقاله، روش‌های عملی برای تبدیل اکسل به DataFrameهای pandas با مثال‌های واضح بررسی خواهیم کرد تا به شما کمک کنیم شروع کنید.

What is a Pandas DataFrame?

یک DataFrame یک ساختار داده دو بعدی است که توسط کتابخانه پاندا ارائه شده است. این ساختار به یک صفحه‌گسترده Excel با ردیف‌ها و ستون‌ها شبیه است. هر ستون می‌تواند انواع مختلف داده‌ها را نگه‌داری کند، مانند رشته‌ها، اعداد صحیح یا اعداد اعشاری.

DataFrames برای:

  • وارد کردن و پاک‌سازی داده‌ها.
  • انجام عملیات ریاضی.
  • فیلتر کردن، گروه بندی و تجمیع داده‌ها.
  • خروجی نتایج به Excel، CSV یا پایگاه‌های داده.

زمانی که فایل‌های اکسل را به DataFrame تبدیل می‌کنید، می‌توانید بلافاصله عملیات قدرتمند pandas را برای تحلیل اعمال کنید.

کتابخانه پایتون برای تبدیل اکسل به DataFrame پاندا

Aspose.Cells for Python via .NET اغلب به عنوان بهترین کتابخانه اکسل پایتون برای توسعه دهندگانی که به بیش از مدیریت ابتدایی جدول‌های محاسباتی نیاز دارند، در نظر گرفته می‌شود. این امکان را برای شما فراهم می‌کند که به صورت برنامه‌نویسی فایل‌های اکسل را ایجاد، بخوانید، ویرایش و تبدیل کنید بدون اینکه نیاز به نصب مایکروسافت اکسل داشته باشید.

برای تبدیل DataFrame، این کتابخانه بخاطر پشتیبانی کامل از ویژگی‌های پیشرفته Excel مانند فرمول‌ها، سلول‌های ادغام شده، نمودارها، جدول‌های محوری و قالب‌بندی شرطی درخشان است. این کتابخانه با فرمت‌های مختلف کار می‌کند، از جمله XLS، XLSX، XLSB، ODS، CSV و JSON.

زمانی که از Aspose.Cells برای انتقال داده‌های Excel به pandas استفاده می‌کنید، تبدیل به DataFrame ها به صورت روان و با دقت بالا انجام می‌شود. این بدین معناست که ساختار، فرمت و مقادیر Excel شما دقیق باقی می‌مانند، در حالی که pandas ابزارهایی را برای تجزیه و تحلیل و تبدیل موثر آن داده‌ها به شما می‌دهد.

اکسل را به دیتافریم پانداس تبدیل کنید

شما می‌توانید یک صفحه‌گسترده جدید ایجاد کنید، داده‌ها را به‌طور برنامه‌نویسی تولید کنید و اکسل را به یک DataFrame پاندا در پایتون تبدیل کنید. این به شما کنترل کامل بر ساختار فایل را می‌دهد در حالی که آن را برای تحلیل فوری در پانداها آماده می‌سازد.

برای تبدیل اکسل به یک DataFrame پاندا، مراحل زیر را دنبال کنید:

  1. یک نمونه از کلاس Workbook را ایجاد کنید.
  2. به اولین ورق کاری و سلول‌های آن دسترسی پیدا کنید.
  3. به سلول‌های ورق گسترده مقادیر اضافه کنید.
  4. Extract rows and headers.
  5. داده‌های استخراج‌شده را به یک DataFrame از pandas تبدیل کنید.

کد نمونه پایتون زیر نشان می‌دهد که چگونه می‌توان اکسل را به یک DataFrame در پانداس تبدیل کرد:

import pandas as pd
from aspose.cells import Workbook

# مرحله 1: یک ورکبوک جدید اکسل با استفاده از Aspose.Cells ایجاد کنید
wb = Workbook()

# گام ۲: به اولین شیت دسترسی پیدا کنید
ws = wb.worksheets.get(0)

# مرحله ۳: به مجموعه سلول‌های worksheet دسترسی پیدا کنید
c = ws.cells

# مرحله ۴: داده‌های نمونه را به صفحه‌گسترده اضافه کنید
c.get("A1").value, c.get("B1").value, c.get("C1").value = "Name", "Age", "City"
c.get("A2").value, c.get("B2").value, c.get("C2").value = "Alice", 25, "New York"
c.get("A3").value, c.get("B3").value, c.get("C3").value = "Bob", 30, "San Francisco"
c.get("A4").value, c.get("B4").value, c.get("C4").value = "Charlie", 35, "Los Angeles"

# مرحله ۵: هدر را از اولین ردیف داده بگیرید
header_idx = c.min_data_row
columns = [cell.value for cell in c.rows[header_idx]]

# گام ۶: سطرهای باقی‌مانده را به عنوان داده جمع‌آوری کنید
data = [
    [cell.value for cell in row]
   for idx, row in enumerate(c.rows)
    if row and idx != header_idx
]

# مرحله ۷: ساخت DataFrame به صورت یکجا
df = pd.DataFrame(data, columns=columns)
print(df)

Output

      Name  Age           City
0    Alice   25       New York
1      Bob   30  San Francisco
2  Charlie   35    Los Angeles

یک پرونده اکسل موجود را به DataFrame پاندا تبدیل کنید

اگر شما قبلاً یک فایل اکسل دارید، می‌توانید آن را بارگذاری کرده و اکسل را مستقیماً به یک DataFrame از pandas در پایتون تبدیل کنید. این به شما این امکان را می‌دهد که ساختار صفحه اصلی را حفظ کرده و در عین حال به طور مؤثرتری با داده‌ها در pandas کار کنید.

انجام مراحل زیر برای بارگذاری و تبدیل یک فایل Excel موجود به یک DataFrame از نوع Pandas:

  1. یک فایل Excel موجود را با استفاده از کلاس Workbook باز کنید.
  2. برگه‌ای را بر اساس نام یا اندیس انتخاب کنید.
  3. تمام ردیف‌ها و ستون‌ها را بخوانید.
  4. Extract headers if available.
  5. نتیجه را به یک DataFrame از pandas تبدیل کنید.

کد پایتون زیر نشان می‌دهد که چگونه یک فایل اکسل موجود را به یک DataFrame از pandas تبدیل کنیم:

import pandas as pd
from aspose.cells import Workbook

# مرحله 1: بارگذاری فایل Excel از فایل
workbook = Workbook("PandasTest.xlsx")

# مرحله ۲: شیت کار را انتخاب کنید (بر اساس ایندکس یا نام)
worksheet = workbook.worksheets.get("Sheet1")  # or workbook.worksheets[0]

# گام ۳: مجموعه سلول‌ها را از کاربرگ بگیرید
cells = worksheet.cells

# مرحله ۴: تعداد ستون‌ها را محاسبه کنید (اختلاف ایندکس مبتنی بر ۰)
col_count = cells.max_data_column - cells.min_data_column

# مرحله ۵: یک لیست برای ذخیره داده‌های ردیف ایجاد کنید
output_data = []

# مرحله ۶: ایندکس اولین ردیف که داده دارد را پیدا کنید
first_data_row_index = cells.min_data_row

# مرحله ۷: از میان تمام ردیف‌ها در صفحه عبور کنید.
for row in cells.rows:
    if row is None:
        continue  # Skip uninitialized rows

    # تمام مقادیر سلول را برای ردیف کنونی جمع آوری کنید
    row_data = [cell.value for cell in row]
    output_data.append(row_data)

# مرحله ۸: آماده‌سازی عنوان‌های ستون
columns = []
if True:  # Use header row
    row = cells.rows[first_data_row_index]
   for cell in row:
        columns.append(cell.value)
    # سطر عنوان را از داده‌ها حذف کنید
    output_data = output_data[1:]
else:
    # اگر هدر وجود نداشته باشد، نام‌های پیش‌فرض ستون‌ها را اختصاص دهید.
    columns = [f"Unnamed: {i}" for i in range(col_count + 1)]

# مرحله ۹: داده‌ها را به یک DataFrame پانداها تبدیل کنید
df = pd.DataFrame(output_data, columns=columns)

# مرحله ۱۰: چاپ DataFrame
print(df)
یک فایل اکسل موجود را به یک DataFrame پانداس تبدیل کنید

فایل نمونه Excel برای تبدیل به یک Pandas DataFrame.

Output

   Product A  Product B Period
0         50        160     Q1
1        100         32     Q2
2        170         50     Q3
3        300         40     Q4

تبدیل اکسل به پاندا از طریق JSON

دامنه Excel خود را با استفاده از JsonUtility.exportrangetojson به JSON صادر کنید، سپس آن را به Pandas بارگذاری کنید. راهنمای مرحله به مرحله را ببینید: Convert Excel to Pandas DataFrame via JSON.

تبدیل اکسل به پانداس از طریق CSV

فایل اکسل خود را به CSV تبدیل کنید و سپس آن را در Pandas بارگذاری کنید. راهنمای گام به گام را دنبال کنید: Convert Excel to Pandas DataFrame via CSV.

مجوز رایگان بگیرید

شما می‌توانید تمام ویژگی‌های Aspose.Cells for Python را از طریق .NET بدون محدودیت‌ها با استفاده از یک مجوز موقت رایگان امتحان کنید. لطفاً به صفحه مجوز مراجعه کرده و یک مجوز رایگان دریافت کنید. این امکان را به شما می‌دهد که API کامل را ارزیابی کنید، از جمله تبدیل‌های پیشرفته Excel به DataFrame.

منابع اضافی رایگان

با استفاده از این منابع، راه‌های بیشتری برای کار با فایل‌های اکسل در پایتون را کشف کنید، که به شما کمک می‌کند فراتر از تبدیل‌های پایه حرکت کنید و Aspose.Cells را به طور مؤثری در پروژه‌های واقعی به کار ببرید.

نتیجه‌گیری

تبدیل فایل‌های Excel به DataFrame های pandas با Aspose.Cells for Python از طریق .NET ساده و قابل اعتماد می‌شود. چه در حال ایجاد اسپردشیت‌های جدید باشید و چه در حال وارد کردن فایل‌های موجود، این کتابخانه انتقال داده‌های با دقت بالا و پشتیبانی کامل از فرمت‌ها را تضمین می‌کند. با ترکیب انعطاف‌پذیری pandas با مدیریت پیشرفته Excel از Aspose.Cells، می‌توانید پردازش داده‌ها را ساده کرده و تحلیل‌های قدرتمند را در Python آزاد کنید.

اگر سوالی دارید، به فروم پشتیبانی رایگان ما مراجعه کنید و تیم ما خوشحال خواهد شد که به شما کمک کند.

همچنین ببینید