การทำงานกับไฟล์ CSV เป็นงานประจำสำหรับนักวิเคราะห์ข้อมูลและนักพัฒนา หากคุณต้องการแปลง CSV เป็น Pandas DataFrame, Pandas มีฟังก์ชัน readcsv() ที่ตรงไปตรงมา แต่บางครั้งคุณต้องการพลังมากขึ้น นี่คือที่ที่ Aspose.Cells for Python เข้ามามีบทบาท ด้วย Aspose.Cells คุณสามารถนำเข้า CSV ใน Pandas พร้อมกับการควบคุม ความเชื่อถือได้ และความเข้ากันได้กับรูปแบบ Excel ที่ดียิ่งขึ้น ในโพสต์บล็อกนี้ คุณจะได้เรียนรู้ทีละขั้นตอนเกี่ยวกับวิธีการแปลง CSV เป็น Pandas จัดการไฟล์ Excel และส่งออกไปยัง Pandas DataFrames

เมื่อตอนจบ คุณจะรู้วิธีหลายอย่างในการแปลงจาก CSV เป็น DataFrame Pandas ได้อย่างรวดเร็วและมีประสิทธิภาพ

ไลบรารี Python สำหรับแปลง CSV เป็น Pandas DataFrame

Aspose.Cells for Python via .NET เป็นไลบรารีที่มีประสิทธิภาพสำหรับการทำงานกับสเปรดชีต มันช่วยให้คุณสร้าง อ่าน แก้ไข และแปลงไฟล์ Excel และ CSV ผ่านโปรแกรมโดยไม่ต้องใช้ Microsoft Excel เมื่อจัดการกับการแปลง CSV ไปยัง Pandas, Aspose.Cells ทำหน้าที่เป็นสะพานที่เชื่อถือได้ระหว่างไฟล์ CSV ดิบและ Pandas DataFrames ที่มีโครงสร้าง

ความต้องการเบื้องต้น

ก่อนเรียกใช้ตัวอย่าง ให้แน่ใจว่าคุณได้ติดตั้งสิ่งต่อไปนี้แล้ว:

pip install aspose-cells-python
  • Pandas – ติดตั้งด้วย pip:
pip install pandas

ห้องสมุดทั้งสองนี้จะช่วยให้คุณโหลดและประมวลผลไฟล์ CSV/Excel ด้วย Aspose.Cells และจากนั้นแปลงเป็น Pandas DataFrames สำหรับการวิเคราะห์

Aspose.Cells for Python ผ่าน .NET → สำหรับการอ่านและประมวลผลไฟล์ CSV/Excel.

Pandas → สำหรับการสร้างและวิเคราะห์ DataFrames.

แปลง CSV เป็น Pandas DataFrame: ขั้นตอนทีละขั้น

ในส่วนนี้ คุณจะได้เรียนรู้กระบวนการทั้งหมดในการแปลงไฟล์ CSV เป็น Pandas DataFrame โดยใช้ Aspose.Cells for Python แต่ละขั้นตอนจะแบ่งออกเป็นงานเล็ก ๆ ซึ่งทำให้คุณสามารถติดตามได้ง่าย คุณจะเริ่มต้นโดยการโหลด CSV เข้าไปในสมุดงาน ดึงข้อมูลออกมาและสร้าง Pandas DataFrame

ขั้นตอนที่ 1: โหลด CSV ลงในสมุดงาน

เรามาเริ่มกันด้วยการโหลดไฟล์ CSV ลงในสมุดงาน Aspose.Cells กันเถอะ

  1. นำเข้าชั้นเรียน Workbook।
  2. โหลดไฟล์ CSV。
  3. เข้าถึงแผ่นงานแรก
import aspose.cells as ac

# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")

# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]

ขั้นตอนที่ 2: ดึงข้อมูลจากเวิร์กชีท

เมื่อไฟล์ถูกโหลดแล้ว ให้ดึงเนื้อหาทีละแถว สิ่งนี้จะเตรียมข้อมูลสำหรับการแปลงเป็น DataFrame.

  1. รับการเก็บรวบรวมเซลล์.
  2. วนรอบผ่านแถวและคอลัมน์
  3. จัดเก็บค่าต่างๆ ในรายชื่อของรายการ
cells = csv_ws.cells

# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

ขั้นตอนที่ 3: แปลง CSV เป็น Pandas DataFrame

ตอนนี้ให้แปลงรายการที่ดึงออกมาเป็น Pandas DataFrame ขั้นตอนนี้จะแสดงวิธีการเปลี่ยนจาก CSV เป็น Pandas DataFrame โดยมีหัวข้อที่ถูกต้อง

  1. นำเข้า Pandas.
  2. ใช้แถวแรกเป็นหัวเรื่อง
  3. สร้าง DataFrame จากแถวที่เหลือ
import pandas as pd

# Convert to Pandas DataFrame
headers = data[0]   # First row as header
rows = data[1:]     # Remaining rows as data

df = pd.DataFrame(rows, columns=headers)

print(df.head())

คุณได้แปลง CSV เป็น DataFrame Pandas โดยใช้ Aspose.Cells สำเร็จแล้วในขณะนี้。

ด้วยขั้นตอนเหล่านี้ คุณได้เห็นวิธีการแปลงไฟล์ CSV เป็น DataFrame ของ Pandas โดยใช้ Aspose.Cells ต่อไป มาสำรวจวิธีการจัดการไฟล์ Excel โดยการบันทึกเป็น CSV ก่อนแล้วค่อยโหลดเข้าสู่ Pandas กันเถอะ

แปลง Excel เป็น Pandas DataFrame ผ่านไฟล์ CSV

บางครั้งข้อมูลของคุณอยู่ในรูปแบบ Excel (.xlsx หรือ .xls) และคุณต้องการแปลง Excel เป็น Pandas DataFrame ผ่าน CSV Aspose.Cells ทำให้สิ่งนี้เป็นไปได้อย่างราบรื่น

ต่อไปนี้คือขั้นตอนในการแปลง Excel เป็น Pandas DataFrames ผ่านไฟล์ CSV:

  1. ไฟล์ Excel ให้โหลดเข้าไปในอ็อบเจ็กต์คลาส Workbook
  2. บันทึกไฟล์ Excel เป็น CSV.
  3. รีโหลดไฟล์ CSV ที่สร้างขึ้นใหม่ไปยังสมุดงาน
  4. เข้าถึงแผ่นงานแรกโดยใช้ดัชนีของมัน
  5. ดึงค่าทั้งหมดจากเซลล์เข้าสู่ลิสต์ของลิสต์ในภาษา Python
  6. ใช้แถวแรกเป็นหัวข้อคอลัมน์และที่เหลือเป็นแถวข้อมูล。
  7. สร้าง Pandas DataFrame จากข้อมูลที่ถูกดึงออกมา
  8. Print the results.

ตัวอย่างโค้ดด้านล่างแสดงวิธีการแปลง Excel เป็น pandas DataFrame ใน Python:

import aspose.cells as ac
import pandas as pd

# โหลดไฟล์ Excel
excel_wb = ac.Workbook("PandasTest.xlsx")

# บันทึก Excel เป็น CSV
excel_wb.save("converted.csv", ac.SaveFormat.CSV)

# รีโหลด CSV ด้วย Aspose.Cells
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]

# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

# แปลงเป็น DataFrame ของ Pandas
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)

# แสดงผลลัพธ์
print(df.head())
แปลง Excel เป็น Pandas DataFrame ผ่าน CSV

ไฟล์ Excel ตัวอย่างสำหรับแปลงเป็น Pandas DataFrame ผ่าน CSV.

Output

   Product A  Product B Period
0         50        160     Q1
1        100         32     Q2
2        170         50     Q3
3        300         40     Q4

การทำงานกับไฟล์ CSV ขนาดใหญ่

สำหรับชุดข้อมูลขนาดใหญ่มาก Aspose.Cells จัดการหน่วยความจำได้ดีกว่า Pandas ปกติ คุณสามารถเปิดใช้งานการเพิ่มประสิทธิภาพหน่วยความจำได้แม้ว่า ให้ทำตามขั้นตอนเดียวกันกับก่อนหน้านี้ การเปลี่ยนแปลงเพียงอย่างเดียวคือการโหลดไฟล์ CSV ด้วย LoadOptions และตั้งค่า MEMORYPREFERENCE เพื่อจัดการกับไฟล์ขนาดใหญ่ได้อย่างมีประสิทธิภาพ

ตัวอย่างโค้ดด้านล่างแสดงวิธีการแปลงไฟล์ CSV ขนาดใหญ่เป็น pandas DataFrame ในภาษา Python:

import aspose.cells as ac
import pandas as pd

# โหลดไฟล์ CSV ขนาดใหญ่ด้วย Aspose.Cells
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]

# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

# แปลงเป็น Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)

# แสดงผลลัพธ์
print(df.head())

สิ่งนี้ทำให้การนำเข้า CSV ใน Pandas มีประสิทธิภาพมากขึ้นในสายงานข้อมูล。

รับใบอนุญาตฟรี

ลอง Aspose.Cells for Python วันนี้เพื่อปรับปรุงการแปลง CSV เป็น Pandas DataFrame ของคุณ ดาวน์โหลด เวอร์ชันทดลองใช้งานฟรีหรือ รับใบอนุญาตชั่วคราว เพื่อสำรวจความสามารถเต็มรูปแบบโดยไม่จำกัด

CSV to DF: Additional Free Resources

คุณสามารถใช้ทรัพยากรด้านล่างเพื่อสำรวจเพิ่มเติมเกี่ยวกับการนำเข้า CSV, การแปลง DataFrame, และคุณสมบัติการประมวลผล Excel และ CSV อื่น ๆ ที่มีอยู่ใน Aspose.Cells for Python.

บทสรุป

ในคู่มือนี้ คุณได้เรียนรู้วิธีโหลดไฟล์ CSV โดยตรงเข้าสู่ Aspose.Cells และแปลงเป็น Pandas DataFrames รวมถึงวิธีบันทึกไฟล์ Excel เป็น CSV ก่อนที่จะนำเข้า ด้วย Pandas, Aspose.Cells จะมอบการควบคุม ประสิทธิภาพ และความยืดหยุ่นที่ดีกว่า ทำให้การประมวลผลข้อมูลของคุณเชื่อถือได้และขยายได้มากขึ้น

หากคุณมีคำถามหรือจำเป็นต้องได้รับความช่วยเหลือ โปรดเยี่ยมชม free support forum ทีมสนับสนุนของเราพร้อมให้ความช่วยเหลือคุณ

ดูเพิ่มเติม