Робота з файлами CSV є щоденним завданням для аналітиків даних та розробників. Якщо вам потрібно конвертувати CSV в Pandas DataFrame, Pandas надає пряму функцію readcsv()
, але іноді вам потрібна більше можливостей. Саме тут на допомогу приходить Aspose.Cells for Python. За допомогою Aspose.Cells ви можете імпортувати CSV в Pandas, забезпечуючи кращий контроль, надійність та сумісність з форматами Excel. У цьому блозі ви дізнаєтеся крок за кроком, як конвертувати CSV в Pandas, працювати з файлами Excel та експортувати їх у Pandas DataFrames.
До кінця ви дізнаєтеся кілька способів швидко і ефективно перетворити CSV у DataFrame Pandas.
Бібліотека Python для перетворення CSV в DataFrame Pandas
Aspose.Cells for Python via .NET - це потужна бібліотека для роботи з електронними таблицями. Вона дозволяє вам створювати, читати, редагувати та конвертувати файли Excel та CSV програмним чином без необхідності в Microsoft Excel. При роботі з конверсіями CSV в Pandas Aspose.Cells виступає надійним мостом між сирими CSV-файлами та структурованими DataFrame-ами Pandas.
Передумови
Перед тим, як запустити приклади, переконайтеся, що у вас встановлено наступне:
- Aspose.Cells for Python через .NET: Завантажити з релізів або встановити за допомогою pip:
pip install aspose-cells-python
- Pandas – встановлення з pip:
pip install pandas
Ці дві бібліотеки дозволять вам завантажувати і обробляти CSV/Excel файли за допомогою Aspose.Cells, а потім конвертувати їх у Pandas DataFrames для аналізу.
Aspose.Cells for Python через .NET → для читання та обробки CSV/Excel файлів.
Pandas → для створення та аналізу DataFrames.
Перетворення CSV в DataFrame Pandas: Крок за Кроком
У цьому розділі ви пройдете через повний процес перетворення файлу CSV у DataFrame Pandas за допомогою Aspose.Cells for Python. Кожен крок поділений на невеликі завдання. Це полегшує вам слідування. Ви почнете з завантаження CSV у робочий зошит. Витягніть його вміст і побудуйте DataFrame Pandas.
Крок 1: Завантажте CSV у робочу книгу
Давайте почнемо з завантаження CSV файлу в робочий зошит Aspose.Cells.
- Імпортуйте клас Workbook.
- Завантажте файл CSV.
- Отримайте перший аркуш.
import aspose.cells as ac
# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")
# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]
Крок 2: Екстракт дані з аркуша
Як тільки файл буде завантажено, витягніть його вміст рядок за рядком. Це підготував дані для перетворення на DataFrame.
- Отримайте колекцію комірок.
- Перебирать рядки та стовпці.
- Сховати значення в списку списків.
cells = csv_ws.cells
# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
Крок 3: Конвертуйте CSV у DataFrame Pandas
Тепер перетворіть витягнутий список у Pandas DataFrame. Цей крок показує, як перейти з CSV до Pandas DataFrame з правильними заголовками.
- Import Pandas.
- Використовуйте перший ряд як заголовки.
- Створіть DataFrame з решти рядків.
import pandas as pd
# Convert to Pandas DataFrame
headers = data[0] # First row as header
rows = data[1:] # Remaining rows as data
df = pd.DataFrame(rows, columns=headers)
print(df.head())
Ви тепер успішно перетворили CSV на DataFrame Pandas за допомогою Aspose.Cells.
З цими кроками ви побачили, як перетворити файл CSV у DataFrame Pandas за допомогою Aspose.Cells. Далі давайте розглянемо, як працювати з файлами Excel, спочатку зберігаючи їх як CSV, а потім завантажуючи їх у Pandas.
Перетворіть Excel в DataFrame Pandas за допомогою CSV-файлу
Іноді ваші дані знаходяться у форматі Excel (.xlsx або .xls), і ви хочете перетворити Excel у DataFrame Pandas через CSV. Aspose.Cells робить це безперешкодним.
Слідуйте наведеним крокам, щоб конвертувати Excel в Pandas DataFrames через CSV файл:
- Завантажте файл Excel у клас об’єкта
Workbook
. - Збережіть файл Excel як CSV.
- Перезавантажте новостворений CSV файл у книгу.
- Отримайте доступ до першого аркуша за його індексом.
- Extract all cell values into a Python list of lists.
- Використовуйте перший ряд як заголовки стовпців, а решту - як ряди даних.
- Створіть DataFrame Pandas з витягнених даних.
- Print the results.
Наступний приклад коду показує, як конвертувати Excel в DataFrame pandas в Python:
import aspose.cells as ac
import pandas as pd
# Завантажте файл Excel
excel_wb = ac.Workbook("PandasTest.xlsx")
# Зберегти Excel як CSV
excel_wb.save("converted.csv", ac.SaveFormat.CSV)
# Перезавантажити CSV з Aspose.Cells
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]
# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# Convert to Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())

Sample Excel file for converting into a Pandas DataFrame via CSV.
Output
Product A Product B Period
0 50 160 Q1
1 100 32 Q2
2 170 50 Q3
3 300 40 Q4
Робота з великими CSV файлами
Для дуже великих наборів даних Aspose.Cells краще обробляє пам’ять, ніж звичайний Pandas. Ви навіть можете активувати оптимізацію пам’яті. Виконайте такі ж кроки, як раніше. Єдина зміна полягає в тому, щоб завантажити CSV файл з LoadOptions
та встановити MEMORYPREFERENCE
, щоб ефективно обробляти великі файли.
Наступний приклад коду показує, як конвертувати великий CSV файл у pandas DataFrame на Python:
import aspose.cells as ac
import pandas as pd
# Завантажте великий CSV файл з Aspose.Cells
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]
# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# Convert to Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())
Це робить імпорт CSV в Pandas більш ефективним у дата-пайплайнах.
Отримайте безкоштовну ліцензію
Спробуйте Aspose.Cells for Python сьогодні, щоб покращити перетворення CSV в Pandas DataFrame. Download безкоштовну версію або get a temporary license, щоб дослідити всі можливості без обмежень.
CSV to DF: Додаткові безкоштовні ресурси
Ви можете використовувати ресурси нижче, щоб дізнатися більше про імпорт CSV, конвертацію DataFrame та інші функції обробки Excel і CSV, доступні в Aspose.Cells for Python.
Висновок
В цьому посібнику ви дізналися, як завантажувати CSV файли безпосередньо в Aspose.Cells і перетворювати їх у Pandas DataFrames, а також як зберігати Excel файли у форматі CSV перед їх імпортом. Разом з Pandas, Aspose.Cells дає вам більший контроль, продуктивність і гнучкість, роблячи ваші завдання обробки даних більш надійними та масштабованими.
Якщо у вас є які-небудь питання або вам потрібна допомога, будь ласка, відвідайте наш безкоштовний форум підтримки.Наша команда підтримки завжди готова вам допомогти.