CSV 파일 작업은 데이터 분석가와 개발자에게 일상적인 작업입니다. CSV를 Pandas DataFrame으로 변환해야 할 경우, Pandas는 직접적인 readcsv()
함수를 제공하지만, 때때로 더 강력한 기능이 필요합니다. 이때 Aspose.Cells for Python이 필요합니다. Aspose.Cells를 사용하면 CSV를 Pandas로 가져오면서 Excel 형식에 대한 더 나은 제어, 신뢰성 및 호환성을 보장할 수 있습니다. 이 블로그 게시물에서는 CSV를 Pandas로 변환하고, Excel 파일을 처리하며, 이를 Pandas DataFrames로 내보내는 방법을 단계별로 배울 것입니다.
끝으로, CSV에서 DataFrame Pandas로 빠르고 효율적으로 가는 여러 가지 방법을 알게 될 것입니다.
파이썬 라이브러리로 CSV를 판다스 데이터프레임으로 변환하기
Aspose.Cells for Python via .NET는 스프레드시트 작업을 위한 강력한 라이브러리입니다. 이 라이브러리를 사용하면 Microsoft Excel 없이도 Excel 및 CSV 파일을 프로그래밍 방식으로 생성, 읽기, 편집 및 변환할 수 있습니다. CSV에서 Pandas로의 변환을 처리할 때, Aspose.Cells는 원시 CSV 파일과 구조화된 Pandas DataFrame 간의 신뢰할 수 있는 다리 역할을 합니다.
전제 조건
다음 예제를 실행하기 전에 다음이 설치되어 있는지 확인하세요:
- Aspose.Cells for Python via .NET: 릴리스에서 다운로드 또는 pip로 설치:
pip install aspose-cells-python
- Pandas – pip로 설치하기:
pip install pandas
이 두 라이브러리는 Aspose.Cells를 사용하여 CSV/Excel 파일을 로드하고 처리한 다음, 이를 Pandas DataFrame으로 변환하여 분석할 수 있도록 해줍니다.
Aspose.Cells for Python via .NET → CSV/Excel 파일을 읽고 처리하기 위해.
판다스 → 데이터프레임을 구축하고 분석하기 위해.
CSV를 Pandas DataFrame으로 변환하기: 단계별 안내
이 섹션에서는 Aspose.Cells for Python을 사용하여 CSV 파일을 Pandas DataFrame으로 변환하는 전체 프로세스를 안내합니다. 각 단계는 작은 작업으로 나뉘어 있습니다. 이를 통해 따라하기 쉽습니다. CSV를 워크북으로 로드하는 것부터 시작합니다. 그 내용을 추출하고 Pandas DataFrame을 구축합니다.
1단계: CSV를 워크북에 로드하기
CSV 파일을 Aspose.Cells 워크북에 로드하는 것부터 시작합시다.
- Workbook 클래스를 가져옵니다.
- CSV 파일을 불러옵니다.
- 첫 번째 워크시트를 열어보세요.
import aspose.cells as ac
# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")
# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]
2단계: 워크시트에서 데이터 추출
파일이 로드되면, 내용을 행별로 추출합니다. 이렇게 하면 데이터를 DataFrame으로 변환할 준비가 됩니다.
- 셀 컬렉션을 가져옵니다.
- 행과 열을 반복하세요.
- 리스트의 리스트에 값을 저장하세요.
cells = csv_ws.cells
# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
Step 3: CSV를 Pandas DataFrame으로 변환하기
이제 추출된 목록을 Pandas DataFrame으로 변환합니다. 이 단계에서는 적절한 헤더로 CSV에서 Pandas DataFrame으로 가는 방법을 보여줍니다.
- Import Pandas.
- 첫 번째 행을 헤더로 사용하십시오.
- 남은 행으로 DataFrame 생성.
import pandas as pd
# Convert to Pandas DataFrame
headers = data[0] # First row as header
rows = data[1:] # Remaining rows as data
df = pd.DataFrame(rows, columns=headers)
print(df.head())
이제 Aspose.Cells를 사용하여 CSV를 DataFrame Pandas로 성공적으로 변환했습니다.
이 단계들로, 우리는 Aspose.Cells를 사용하여 CSV 파일을 Pandas DataFrame으로 변환하는 방법을 보았습니다. 다음으로, Excel 파일을 CSV로 저장한 다음 Pandas로 로드하는 방법을 살펴보겠습니다.
Excel을 CSV 파일을 통해 Pandas DataFrame으로 변환하기
때때로 데이터가 Excel 형식(.xlsx 또는 .xls)이고 Excel을 CSV를 통해 Pandas DataFrame으로 변환하려는 경우 Aspose.Cells가 이를 원활하게 수행합니다.
다음 단계를 따라 Excel을 CSV 파일을 통한 Pandas DataFrame으로 변환하십시오:
Workbook
클래스 객체에 Excel 파일을 로드하십시오.- Excel 파일을 CSV로 저장하십시오.
- 새로 생성된 CSV 파일을 워크북으로 다시 불러옵니다.
- 첫 번째 워크시트를 인덱스로 접근하십시오.
- 모든 셀 값을 파이썬 리스트의 리스트로 추출합니다.
- 첫 번째 행을 열 머리글로 사용하고 나머지를 데이터 행으로 사용하십시오.
- 추출한 데이터로 Pandas DataFrame을 생성합니다.
- Print the results.
다음 코드는 Python에서 Excel을 pandas DataFrame으로 변환하는 방법을 보여줍니다:
import aspose.cells as ac
import pandas as pd
# Excel 파일을 불러오세요.
excel_wb = ac.Workbook("PandasTest.xlsx")
# Excel을 CSV로 저장하기
excel_wb.save("converted.csv", ac.SaveFormat.CSV)
# Aspose.Cells로 CSV 다시 로드하기
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]
# CSV에서 데이터 추출하기
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# Pandas DataFrame로 변환하십시오.
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())

샘플 Excel 파일을 CSV를 통해 Pandas DataFrame으로 변환하는 것입니다.
Output
Product A Product B Period
0 50 160 Q1
1 100 32 Q2
2 170 50 Q3
3 300 40 Q4
대용량 CSV 파일 다루기
매우 큰 데이터셋의 경우, Aspose.Cells는 일반 Pandas보다 메모리를 더 잘 처리합니다. 심지어 메모리 최적화를 활성화할 수도 있습니다. 이전과 같은 단계를 따르세요. 유일한 변화는 LoadOptions
로 CSV 파일을 로드하고 큰 파일을 효율적으로 처리하기 위해 MEMORYPREFERENCE
를 설정하는 것입니다.
다음 코드 예제는 큰 CSV 파일을 Python의 pandas DataFrame으로 변환하는 방법을 보여줍니다:
import aspose.cells as ac
import pandas as pd
# Aspose.Cells로 대용량 CSV 파일을 로드하세요.
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]
# CSV에서 데이터 추출
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# Pandas DataFrame로 변환하십시오.
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())
이것은 데이터 파이프라인에서 Pandas의 CSV 가져오기를 더 효율적으로 만듭니다.
무료 라이선스 받기
오늘 CSV를 Pandas DataFrame으로 변환하는 데 Aspose.Cells for Python을 사용해 보세요. Download 무료 체험판을 다운로드하거나 get a temporary license 전체 기능을 제한 없이 탐색하세요.
CSV to DF: 추가 무료 리소스
아래 리소스를 사용하여 Aspose.Cells for Python에서 사용할 수 있는 CSV 가져오기, DataFrame 변환 및 기타 Excel 및 CSV 처리 기능에 대해 더 알아볼 수 있습니다.
결론
이 가이드에서는 CSV 파일을 Aspose.Cells에 직접 로드하고 이를 Pandas DataFrame으로 변환하는 방법과 Excel 파일을 CSV로 저장한 후 가져오는 방법을 배웠습니다. Pandas와 함께 Aspose.Cells는 데이터 처리 작업을 더 신뢰할 수 있고 확장 가능하게 만들며 더 큰 제어, 성능 및 유연성을 제공합니다.
질문이 있거나 도움이 필요하시면, 저희의 무료 지원 포럼을 방문해 주시기 바랍니다. 저희 지원팀이 도와드릴 수 있습니다.