การทำงานกับไฟล์ CSV เป็นงานประจำสำหรับนักวิเคราะห์ข้อมูลและนักพัฒนา หากคุณต้องการแปลง CSV เป็น Pandas DataFrame, Pandas มีฟังก์ชัน readcsv()
ที่ตรงไปตรงมา แต่บางครั้งคุณต้องการพลังมากขึ้น นี่คือที่ที่ Aspose.Cells for Python เข้ามามีบทบาท ด้วย Aspose.Cells คุณสามารถนำเข้า CSV ใน Pandas พร้อมกับการควบคุม ความเชื่อถือได้ และความเข้ากันได้กับรูปแบบ Excel ที่ดียิ่งขึ้น ในโพสต์บล็อกนี้ คุณจะได้เรียนรู้ทีละขั้นตอนเกี่ยวกับวิธีการแปลง CSV เป็น Pandas จัดการไฟล์ Excel และส่งออกไปยัง Pandas DataFrames
เมื่อตอนจบ คุณจะรู้วิธีหลายอย่างในการแปลงจาก CSV เป็น DataFrame Pandas ได้อย่างรวดเร็วและมีประสิทธิภาพ
ไลบรารี Python สำหรับแปลง CSV เป็น Pandas DataFrame
Aspose.Cells for Python via .NET เป็นไลบรารีที่มีประสิทธิภาพสำหรับการทำงานกับสเปรดชีต มันช่วยให้คุณสร้าง อ่าน แก้ไข และแปลงไฟล์ Excel และ CSV ผ่านโปรแกรมโดยไม่ต้องใช้ Microsoft Excel เมื่อจัดการกับการแปลง CSV ไปยัง Pandas, Aspose.Cells ทำหน้าที่เป็นสะพานที่เชื่อถือได้ระหว่างไฟล์ CSV ดิบและ Pandas DataFrames ที่มีโครงสร้าง
ความต้องการเบื้องต้น
ก่อนเรียกใช้ตัวอย่าง ให้แน่ใจว่าคุณได้ติดตั้งสิ่งต่อไปนี้แล้ว:
- Aspose.Cells for Python ผ่าน .NET: ดาวน์โหลดจาก releases หรือติดตั้งด้วย pip:
pip install aspose-cells-python
- Pandas – ติดตั้งด้วย pip:
pip install pandas
ห้องสมุดทั้งสองนี้จะช่วยให้คุณโหลดและประมวลผลไฟล์ CSV/Excel ด้วย Aspose.Cells และจากนั้นแปลงเป็น Pandas DataFrames สำหรับการวิเคราะห์
Aspose.Cells for Python ผ่าน .NET → สำหรับการอ่านและประมวลผลไฟล์ CSV/Excel.
Pandas → สำหรับการสร้างและวิเคราะห์ DataFrames.
แปลง CSV เป็น Pandas DataFrame: ขั้นตอนทีละขั้น
ในส่วนนี้ คุณจะได้เรียนรู้กระบวนการทั้งหมดในการแปลงไฟล์ CSV เป็น Pandas DataFrame โดยใช้ Aspose.Cells for Python แต่ละขั้นตอนจะแบ่งออกเป็นงานเล็ก ๆ ซึ่งทำให้คุณสามารถติดตามได้ง่าย คุณจะเริ่มต้นโดยการโหลด CSV เข้าไปในสมุดงาน ดึงข้อมูลออกมาและสร้าง Pandas DataFrame
ขั้นตอนที่ 1: โหลด CSV ลงในสมุดงาน
เรามาเริ่มกันด้วยการโหลดไฟล์ CSV ลงในสมุดงาน Aspose.Cells กันเถอะ
- นำเข้าชั้นเรียน Workbook।
- โหลดไฟล์ CSV。
- เข้าถึงแผ่นงานแรก
import aspose.cells as ac
# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")
# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]
ขั้นตอนที่ 2: ดึงข้อมูลจากเวิร์กชีท
เมื่อไฟล์ถูกโหลดแล้ว ให้ดึงเนื้อหาทีละแถว สิ่งนี้จะเตรียมข้อมูลสำหรับการแปลงเป็น DataFrame.
- รับการเก็บรวบรวมเซลล์.
- วนรอบผ่านแถวและคอลัมน์
- จัดเก็บค่าต่างๆ ในรายชื่อของรายการ
cells = csv_ws.cells
# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
ขั้นตอนที่ 3: แปลง CSV เป็น Pandas DataFrame
ตอนนี้ให้แปลงรายการที่ดึงออกมาเป็น Pandas DataFrame ขั้นตอนนี้จะแสดงวิธีการเปลี่ยนจาก CSV เป็น Pandas DataFrame โดยมีหัวข้อที่ถูกต้อง
- นำเข้า Pandas.
- ใช้แถวแรกเป็นหัวเรื่อง
- สร้าง DataFrame จากแถวที่เหลือ
import pandas as pd
# Convert to Pandas DataFrame
headers = data[0] # First row as header
rows = data[1:] # Remaining rows as data
df = pd.DataFrame(rows, columns=headers)
print(df.head())
คุณได้แปลง CSV เป็น DataFrame Pandas โดยใช้ Aspose.Cells สำเร็จแล้วในขณะนี้。
ด้วยขั้นตอนเหล่านี้ คุณได้เห็นวิธีการแปลงไฟล์ CSV เป็น DataFrame ของ Pandas โดยใช้ Aspose.Cells ต่อไป มาสำรวจวิธีการจัดการไฟล์ Excel โดยการบันทึกเป็น CSV ก่อนแล้วค่อยโหลดเข้าสู่ Pandas กันเถอะ
แปลง Excel เป็น Pandas DataFrame ผ่านไฟล์ CSV
บางครั้งข้อมูลของคุณอยู่ในรูปแบบ Excel (.xlsx หรือ .xls) และคุณต้องการแปลง Excel เป็น Pandas DataFrame ผ่าน CSV Aspose.Cells ทำให้สิ่งนี้เป็นไปได้อย่างราบรื่น
ต่อไปนี้คือขั้นตอนในการแปลง Excel เป็น Pandas DataFrames ผ่านไฟล์ CSV:
- ไฟล์ Excel ให้โหลดเข้าไปในอ็อบเจ็กต์คลาส
Workbook
- บันทึกไฟล์ Excel เป็น CSV.
- รีโหลดไฟล์ CSV ที่สร้างขึ้นใหม่ไปยังสมุดงาน
- เข้าถึงแผ่นงานแรกโดยใช้ดัชนีของมัน
- ดึงค่าทั้งหมดจากเซลล์เข้าสู่ลิสต์ของลิสต์ในภาษา Python
- ใช้แถวแรกเป็นหัวข้อคอลัมน์และที่เหลือเป็นแถวข้อมูล。
- สร้าง Pandas DataFrame จากข้อมูลที่ถูกดึงออกมา
- Print the results.
ตัวอย่างโค้ดด้านล่างแสดงวิธีการแปลง Excel เป็น pandas DataFrame ใน Python:
import aspose.cells as ac
import pandas as pd
# โหลดไฟล์ Excel
excel_wb = ac.Workbook("PandasTest.xlsx")
# บันทึก Excel เป็น CSV
excel_wb.save("converted.csv", ac.SaveFormat.CSV)
# รีโหลด CSV ด้วย Aspose.Cells
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]
# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# แปลงเป็น DataFrame ของ Pandas
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# แสดงผลลัพธ์
print(df.head())

ไฟล์ Excel ตัวอย่างสำหรับแปลงเป็น Pandas DataFrame ผ่าน CSV.
Output
Product A Product B Period
0 50 160 Q1
1 100 32 Q2
2 170 50 Q3
3 300 40 Q4
การทำงานกับไฟล์ CSV ขนาดใหญ่
สำหรับชุดข้อมูลขนาดใหญ่มาก Aspose.Cells จัดการหน่วยความจำได้ดีกว่า Pandas ปกติ คุณสามารถเปิดใช้งานการเพิ่มประสิทธิภาพหน่วยความจำได้แม้ว่า ให้ทำตามขั้นตอนเดียวกันกับก่อนหน้านี้ การเปลี่ยนแปลงเพียงอย่างเดียวคือการโหลดไฟล์ CSV ด้วย LoadOptions
และตั้งค่า MEMORYPREFERENCE
เพื่อจัดการกับไฟล์ขนาดใหญ่ได้อย่างมีประสิทธิภาพ
ตัวอย่างโค้ดด้านล่างแสดงวิธีการแปลงไฟล์ CSV ขนาดใหญ่เป็น pandas DataFrame ในภาษา Python:
import aspose.cells as ac
import pandas as pd
# โหลดไฟล์ CSV ขนาดใหญ่ด้วย Aspose.Cells
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]
# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# แปลงเป็น Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# แสดงผลลัพธ์
print(df.head())
สิ่งนี้ทำให้การนำเข้า CSV ใน Pandas มีประสิทธิภาพมากขึ้นในสายงานข้อมูล。
รับใบอนุญาตฟรี
ลอง Aspose.Cells for Python วันนี้เพื่อปรับปรุงการแปลง CSV เป็น Pandas DataFrame ของคุณ ดาวน์โหลด เวอร์ชันทดลองใช้งานฟรีหรือ รับใบอนุญาตชั่วคราว เพื่อสำรวจความสามารถเต็มรูปแบบโดยไม่จำกัด
CSV to DF: Additional Free Resources
คุณสามารถใช้ทรัพยากรด้านล่างเพื่อสำรวจเพิ่มเติมเกี่ยวกับการนำเข้า CSV, การแปลง DataFrame, และคุณสมบัติการประมวลผล Excel และ CSV อื่น ๆ ที่มีอยู่ใน Aspose.Cells for Python.
บทสรุป
ในคู่มือนี้ คุณได้เรียนรู้วิธีโหลดไฟล์ CSV โดยตรงเข้าสู่ Aspose.Cells และแปลงเป็น Pandas DataFrames รวมถึงวิธีบันทึกไฟล์ Excel เป็น CSV ก่อนที่จะนำเข้า ด้วย Pandas, Aspose.Cells จะมอบการควบคุม ประสิทธิภาพ และความยืดหยุ่นที่ดีกว่า ทำให้การประมวลผลข้อมูลของคุณเชื่อถือได้และขยายได้มากขึ้น
หากคุณมีคำถามหรือจำเป็นต้องได้รับความช่วยเหลือ โปรดเยี่ยมชม free support forum ทีมสนับสนุนของเราพร้อมให้ความช่วยเหลือคุณ