فایلهای اکسل همچنان یکی از محبوبترین فرمتها برای مدیریت دادههای ساختاریافته هستند. در پایتون، DataFrame کتابخانه pandas ساختار اصلی برای سازماندهی و تحلیل کارآمد آن دادهها است. پس از تبدیل به یک DataFrame، دادههای اکسل میتوانند به راحتی با پایگاههای داده، APIها، یا مدلهای یادگیری ماشین ترکیب شوند تا تحلیل و بینشهای عمیقتری را فراهم کنند. در این مقاله، روشهای عملی برای تبدیل اکسل به DataFrameهای pandas با مثالهای واضح بررسی خواهیم کرد تا به شما کمک کنیم شروع کنید.
What is a Pandas DataFrame?
یک DataFrame یک ساختار داده دو بعدی است که توسط کتابخانه پاندا ارائه شده است. این ساختار به یک صفحهگسترده Excel با ردیفها و ستونها شبیه است. هر ستون میتواند انواع مختلف دادهها را نگهداری کند، مانند رشتهها، اعداد صحیح یا اعداد اعشاری.
DataFrames برای:
- وارد کردن و پاکسازی دادهها.
- انجام عملیات ریاضی.
- فیلتر کردن، گروه بندی و تجمیع دادهها.
- خروجی نتایج به Excel، CSV یا پایگاههای داده.
زمانی که فایلهای اکسل را به DataFrame تبدیل میکنید، میتوانید بلافاصله عملیات قدرتمند pandas را برای تحلیل اعمال کنید.
کتابخانه پایتون برای تبدیل اکسل به DataFrame پاندا
Aspose.Cells for Python via .NET اغلب به عنوان بهترین کتابخانه اکسل پایتون برای توسعه دهندگانی که به بیش از مدیریت ابتدایی جدولهای محاسباتی نیاز دارند، در نظر گرفته میشود. این امکان را برای شما فراهم میکند که به صورت برنامهنویسی فایلهای اکسل را ایجاد، بخوانید، ویرایش و تبدیل کنید بدون اینکه نیاز به نصب مایکروسافت اکسل داشته باشید.
برای تبدیل DataFrame، این کتابخانه بخاطر پشتیبانی کامل از ویژگیهای پیشرفته Excel مانند فرمولها، سلولهای ادغام شده، نمودارها، جدولهای محوری و قالببندی شرطی درخشان است. این کتابخانه با فرمتهای مختلف کار میکند، از جمله XLS، XLSX، XLSB، ODS، CSV و JSON.
زمانی که از Aspose.Cells برای انتقال دادههای Excel به pandas استفاده میکنید، تبدیل به DataFrame ها به صورت روان و با دقت بالا انجام میشود. این بدین معناست که ساختار، فرمت و مقادیر Excel شما دقیق باقی میمانند، در حالی که pandas ابزارهایی را برای تجزیه و تحلیل و تبدیل موثر آن دادهها به شما میدهد.
اکسل را به دیتافریم پانداس تبدیل کنید
شما میتوانید یک صفحهگسترده جدید ایجاد کنید، دادهها را بهطور برنامهنویسی تولید کنید و اکسل را به یک DataFrame پاندا در پایتون تبدیل کنید. این به شما کنترل کامل بر ساختار فایل را میدهد در حالی که آن را برای تحلیل فوری در پانداها آماده میسازد.
برای تبدیل اکسل به یک DataFrame پاندا، مراحل زیر را دنبال کنید:
- یک نمونه از کلاس
Workbookرا ایجاد کنید. - به اولین ورق کاری و سلولهای آن دسترسی پیدا کنید.
- به سلولهای ورق گسترده مقادیر اضافه کنید.
- Extract rows and headers.
- دادههای استخراجشده را به یک DataFrame از pandas تبدیل کنید.
کد نمونه پایتون زیر نشان میدهد که چگونه میتوان اکسل را به یک DataFrame در پانداس تبدیل کرد:
import pandas as pd
from aspose.cells import Workbook
# مرحله 1: یک ورکبوک جدید اکسل با استفاده از Aspose.Cells ایجاد کنید
wb = Workbook()
# گام ۲: به اولین شیت دسترسی پیدا کنید
ws = wb.worksheets.get(0)
# مرحله ۳: به مجموعه سلولهای worksheet دسترسی پیدا کنید
c = ws.cells
# مرحله ۴: دادههای نمونه را به صفحهگسترده اضافه کنید
c.get("A1").value, c.get("B1").value, c.get("C1").value = "Name", "Age", "City"
c.get("A2").value, c.get("B2").value, c.get("C2").value = "Alice", 25, "New York"
c.get("A3").value, c.get("B3").value, c.get("C3").value = "Bob", 30, "San Francisco"
c.get("A4").value, c.get("B4").value, c.get("C4").value = "Charlie", 35, "Los Angeles"
# مرحله ۵: هدر را از اولین ردیف داده بگیرید
header_idx = c.min_data_row
columns = [cell.value for cell in c.rows[header_idx]]
# گام ۶: سطرهای باقیمانده را به عنوان داده جمعآوری کنید
data = [
[cell.value for cell in row]
for idx, row in enumerate(c.rows)
if row and idx != header_idx
]
# مرحله ۷: ساخت DataFrame به صورت یکجا
df = pd.DataFrame(data, columns=columns)
print(df)
Output
Name Age City
0 Alice 25 New York
1 Bob 30 San Francisco
2 Charlie 35 Los Angeles
یک پرونده اکسل موجود را به DataFrame پاندا تبدیل کنید
اگر شما قبلاً یک فایل اکسل دارید، میتوانید آن را بارگذاری کرده و اکسل را مستقیماً به یک DataFrame از pandas در پایتون تبدیل کنید. این به شما این امکان را میدهد که ساختار صفحه اصلی را حفظ کرده و در عین حال به طور مؤثرتری با دادهها در pandas کار کنید.
انجام مراحل زیر برای بارگذاری و تبدیل یک فایل Excel موجود به یک DataFrame از نوع Pandas:
- یک فایل Excel موجود را با استفاده از کلاس
Workbookباز کنید. - برگهای را بر اساس نام یا اندیس انتخاب کنید.
- تمام ردیفها و ستونها را بخوانید.
- Extract headers if available.
- نتیجه را به یک DataFrame از pandas تبدیل کنید.
کد پایتون زیر نشان میدهد که چگونه یک فایل اکسل موجود را به یک DataFrame از pandas تبدیل کنیم:
import pandas as pd
from aspose.cells import Workbook
# مرحله 1: بارگذاری فایل Excel از فایل
workbook = Workbook("PandasTest.xlsx")
# مرحله ۲: شیت کار را انتخاب کنید (بر اساس ایندکس یا نام)
worksheet = workbook.worksheets.get("Sheet1") # or workbook.worksheets[0]
# گام ۳: مجموعه سلولها را از کاربرگ بگیرید
cells = worksheet.cells
# مرحله ۴: تعداد ستونها را محاسبه کنید (اختلاف ایندکس مبتنی بر ۰)
col_count = cells.max_data_column - cells.min_data_column
# مرحله ۵: یک لیست برای ذخیره دادههای ردیف ایجاد کنید
output_data = []
# مرحله ۶: ایندکس اولین ردیف که داده دارد را پیدا کنید
first_data_row_index = cells.min_data_row
# مرحله ۷: از میان تمام ردیفها در صفحه عبور کنید.
for row in cells.rows:
if row is None:
continue # Skip uninitialized rows
# تمام مقادیر سلول را برای ردیف کنونی جمع آوری کنید
row_data = [cell.value for cell in row]
output_data.append(row_data)
# مرحله ۸: آمادهسازی عنوانهای ستون
columns = []
if True: # Use header row
row = cells.rows[first_data_row_index]
for cell in row:
columns.append(cell.value)
# سطر عنوان را از دادهها حذف کنید
output_data = output_data[1:]
else:
# اگر هدر وجود نداشته باشد، نامهای پیشفرض ستونها را اختصاص دهید.
columns = [f"Unnamed: {i}" for i in range(col_count + 1)]
# مرحله ۹: دادهها را به یک DataFrame پانداها تبدیل کنید
df = pd.DataFrame(output_data, columns=columns)
# مرحله ۱۰: چاپ DataFrame
print(df)

فایل نمونه Excel برای تبدیل به یک Pandas DataFrame.
Output
Product A Product B Period
0 50 160 Q1
1 100 32 Q2
2 170 50 Q3
3 300 40 Q4
تبدیل اکسل به پاندا از طریق JSON
دامنه Excel خود را با استفاده از
JsonUtility.exportrangetojsonبه JSON صادر کنید، سپس آن را به Pandas بارگذاری کنید. راهنمای مرحله به مرحله را ببینید: Convert Excel to Pandas DataFrame via JSON.
تبدیل اکسل به پانداس از طریق CSV
فایل اکسل خود را به CSV تبدیل کنید و سپس آن را در Pandas بارگذاری کنید. راهنمای گام به گام را دنبال کنید: Convert Excel to Pandas DataFrame via CSV.
مجوز رایگان بگیرید
شما میتوانید تمام ویژگیهای Aspose.Cells for Python را از طریق .NET بدون محدودیتها با استفاده از یک مجوز موقت رایگان امتحان کنید. لطفاً به صفحه مجوز مراجعه کرده و یک مجوز رایگان دریافت کنید. این امکان را به شما میدهد که API کامل را ارزیابی کنید، از جمله تبدیلهای پیشرفته Excel به DataFrame.
منابع اضافی رایگان
با استفاده از این منابع، راههای بیشتری برای کار با فایلهای اکسل در پایتون را کشف کنید، که به شما کمک میکند فراتر از تبدیلهای پایه حرکت کنید و Aspose.Cells را به طور مؤثری در پروژههای واقعی به کار ببرید.
نتیجهگیری
تبدیل فایلهای Excel به DataFrame های pandas با Aspose.Cells for Python از طریق .NET ساده و قابل اعتماد میشود. چه در حال ایجاد اسپردشیتهای جدید باشید و چه در حال وارد کردن فایلهای موجود، این کتابخانه انتقال دادههای با دقت بالا و پشتیبانی کامل از فرمتها را تضمین میکند. با ترکیب انعطافپذیری pandas با مدیریت پیشرفته Excel از Aspose.Cells، میتوانید پردازش دادهها را ساده کرده و تحلیلهای قدرتمند را در Python آزاد کنید.
اگر سوالی دارید، به فروم پشتیبانی رایگان ما مراجعه کنید و تیم ما خوشحال خواهد شد که به شما کمک کند.
