處理 CSV 文件是數據分析師和開發人員的日常任務。如果您需要將 CSV 轉換為 Pandas DataFrame,Pandas 提供了直接的 readcsv() 函數,但有時候您需要更多的功能。這時 Aspose.Cells for Python 就派上用場了。使用 Aspose.Cells,您可以在 Pandas 中導入 CSV,同時確保對 Excel 格式具有更好的控制、可靠性和兼容性。在這篇博文中,您將學習逐步如何將 CSV 轉換為 Pandas、處理 Excel 文件,並將其導出到 Pandas DataFrames。
到最後,您將知道多種快速且高效地將 CSV 轉換為 DataFrame Pandas 的方法。
將 CSV 轉換為 Pandas DataFrame 的 Python 函式庫
Aspose.Cells for Python via .NET 是一個強大的庫,用於處理電子表格。它允許您以編程方式創建、閱讀、編輯和轉換 Excel 和 CSV 文件,而無需 Microsoft Excel。在處理 CSV 到 Pandas 的轉換時,Aspose.Cells 作為原始 CSV 文件和結構化 Pandas DataFrames 之間可靠的橋樑。
先決條件
在執行範例之前,請確保您已安裝以下內容:
- Aspose.Cells for Python via .NET: 從釋出下載 或使用 pip 安裝:
pip install aspose-cells-python
- Pandas – 使用 pip 安裝:
pip install pandas
這兩個庫將允許您使用 Aspose.Cells 加載和處理 CSV/Excel 文件,然後將它們轉換為 Pandas DataFrames 以進行分析。
Aspose.Cells for Python via .NET → 用於讀取和處理 CSV/Excel 檔案。
Pandas → 用於構建和分析 DataFrames。
將 CSV 轉換為 Pandas DataFrame:逐步指南
在本節中,您將詳細了解如何使用 Aspose.Cells for Python 將 CSV 文件轉換為 Pandas DataFrame 的完整過程。每個步驟都被劃分為小任務。這使您更容易跟隨。您將首先將 CSV 加載到工作簿中。提取其內容並構建 Pandas DataFrame。
第 1 步:將 CSV 載入工作簿
讓我們開始將 CSV 文件載入 Aspose.Cells 工作簿。
- 匯入 Workbook 類別。
- 載入 CSV 檔案。
- 訪問第一個工作表。
import aspose.cells as ac
# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")
# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]
步驟 2:從工作表中提取數據
一旦文件加載完成,逐行提取其內容。這為將數據轉換為數據框作準備。
- 獲取單元格集合。
- 遍歷行和列。
- 在列表的列表中存儲值。
cells = csv_ws.cells
# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
步驟 3:將 CSV 轉換為 Pandas DataFrame
現在,將提取的列表轉換為 Pandas DataFrame。這一步顯示如何從 CSV 轉換為具有正確標題的 Pandas DataFrame。
- 導入 Pandas。
- 使用第一行作為標題。
- 從剩餘的行創建 DataFrame。
import pandas as pd
# Convert to Pandas DataFrame
headers = data[0] # First row as header
rows = data[1:] # Remaining rows as data
df = pd.DataFrame(rows, columns=headers)
print(df.head())
您現在已成功使用 Aspose.Cells 將 CSV 轉換為 DataFrame Pandas。
透過這些步驟,您已經看到了如何使用 Aspose.Cells 將 CSV 文件轉換為 Pandas DataFrame。接下來,讓我們探索如何處理 Excel 文件,首先將它們保存為 CSV,然後將其加載到 Pandas 中。
將 Excel 轉換為通過 CSV 文件的 Pandas DataFrame
有時候您的數據是以 Excel 格式 (.xlsx 或 .xls) 存在,您想通過 CSV 將 Excel 轉換為 Pandas DataFrame。Aspose.Cells 讓這一切變得輕而易舉。
按照以下步驟通過 CSV 文件將 Excel 轉換為 Pandas DataFrames:
- 將 Excel 檔案載入
Workbook類別物件。 - 將 Excel 文件另存為 CSV。
- 重新將新創建的 CSV 檔案加載到工作簿中。
- 通過索引訪問第一個工作表。
- 提取所有單元格的值到一個 Python 列表的列表中。
- 使用第一行作為列標題,其餘行作為數據行。
- 從提取的數據中創建一個 Pandas DataFrame。
- Print the results.
以下代碼示例顯示了如何在 Python 中將 Excel 轉換為 pandas DataFrame:
import aspose.cells as ac
import pandas as pd
# 載入 Excel 文件
excel_wb = ac.Workbook("PandasTest.xlsx")
# 將 Excel 保存為 CSV
excel_wb.save("converted.csv", ac.SaveFormat.CSV)
# 使用 Aspose.Cells 重新加載 CSV
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]
# 從 CSV 中提取數據
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# 轉換為 Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())

將 Excel 文件範本轉換為 Pandas DataFrame 的 CSV。
Output
Product A Product B Period
0 50 160 Q1
1 100 32 Q2
2 170 50 Q3
3 300 40 Q4
處理大型 CSV 檔案
對於非常大的數據集,Aspose.Cells 比純粹的 Pandas 更好地處理內存。您甚至可以啟用內存優化。請按照之前的步驟進行。唯一的改變是用 LoadOptions 加載 CSV 文件並將 MEMORYPREFERENCE 設置為高效處理大型文件。
以下代碼示例顯示如何在 Python 中將大型 CSV 文件轉換為 pandas DataFrame:
import aspose.cells as ac
import pandas as pd
# 使用 Aspose.Cells 加載大型 CSV 文件
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]
# 從 CSV 中提取數據
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# 轉換為 Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())
這使得在數據管道中導入 CSV 文件在 Pandas 中更有效率。
獲取免費許可證
今天就試試 Aspose.Cells for Python,提升您的 CSV 轉換為 Pandas DataFrame 的能力。 下載 免費試用版或 獲取臨時許可證 以探索完整功能而不受限制。
CSV to DF: 額外免費資源
您可以使用以下資源來深入瞭解有關 CSV 匯入、DataFrame 轉換以及 Aspose.Cells for Python 中可用的其他 Excel 和 CSV 處理功能。
結論
在這個指南中,您學會了如何直接將 CSV 文件加載到 Aspose.Cells 並將其轉換為 Pandas DataFrames,以及如何在導入之前將 Excel 文件另存為 CSV。結合 Pandas,Aspose.Cells 讓您對數據處理任務擁有更大的控制力、性能和靈活性,使您的數據處理任務更加可靠和可擴展。
如果您有任何問題或需要協助,請訪問我們的 free support forum。我們的支援團隊隨時為您提供幫助。
