Работа с CSV файлами является ежедневной задачей для аналитиков данных и разработчиков. Если вам нужно преобразовать CSV в Pandas DataFrame, Pandas предоставляет прямую функцию readcsv(), но иногда вам нужна больше мощность. Вот где наступает Aspose.Cells for Python. С помощью Aspose.Cells вы можете импортировать CSV в Pandas, обеспечивая лучшее управление, надежность и совместимость с форматами Excel. В этом блоге вы узнаете пошагово, как преобразовать CSV в Pandas, работать с Excel файлами и экспортировать их в Pandas DataFrames.
К концу вы узнаете несколько способов быстро и эффективно перейти от CSV к DataFrame Pandas.
Библиотека Python для преобразования CSV в DataFrame Pandas
Aspose.Cells for Python через .NET является мощной библиотекой для работы с электронными таблицами. Она позволяет вам программно создавать, читать, редактировать и конвертировать файлы Excel и CSV без необходимости в Microsoft Excel. При работе с конверсиями CSV в Pandas Aspose.Cells действует как надежный мост между сырыми CSV файлами и структурированными Pandas DataFrame.
Предварительные требования
Перед запуском примеров убедитесь, что у вас установлено следующее:
- Aspose.Cells for Python через .NET: Скачать из релизов или установить с помощью pip:
pip install aspose-cells-python
- Pandas – установить с помощью pip:
pip install pandas
Эти две библиотеки позволят вам загружать и обрабатывать файлы CSV/Excel с помощью Aspose.Cells, а затем преобразовывать их в DataFrame Pandas для анализа.
Aspose.Cells for Python через .NET → для чтения и обработки файлов CSV/Excel.
Pandas → для построения и анализа DataFrame.
Преобразуйте CSV в DataFrame Pandas: Шаг за шагом
В этом разделе вы пройдете через полный процесс преобразования CSV-файла в DataFrame Pandas с помощью Aspose.Cells for Python. Каждый этап разбит на небольшие задачи. Это облегчает вам следование. Вы начнете с загрузки CSV в рабочую книгу. Извлеките его содержимое и создайте DataFrame Pandas.
Шаг 1: Загрузите CSV в книгу.
Давайте начнем с загрузки файла CSV в рабочую книгу Aspose.Cells.
- Импортируйте класс Workbook.
- Загрузите файл CSV.
- Доступ к первому листу.
import aspose.cells as ac
# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")
# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]
Шаг 2: Извлечение данных из рабочей книги
Как только файл загружен, извлеките его содержимое строка за строкой. Это подготавливает данные для конверсии в DataFrame.
- Получите сбор клеток.
- Перебирать строки и столбцы.
- Храните значения в списке списков.
cells = csv_ws.cells
# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
Шаг 3: Преобразуйте CSV в DataFrame Pandas
Теперь преобразуйте извлеченный список в DataFrame Pandas. Этот шаг демонстрирует, как перейти от CSV к DataFrame Pandas с правильными заголовками.
- Импортируйте Pandas.
- Используйте первый ряд в качестве заголовков.
- Создайте DataFrame из оставшихся строк.
import pandas as pd
# Convert to Pandas DataFrame
headers = data[0] # First row as header
rows = data[1:] # Remaining rows as data
df = pd.DataFrame(rows, columns=headers)
print(df.head())
Вы успешно преобразовали CSV в DataFrame Pandas с использованием Aspose.Cells.
С этими шагами вы увидели, как преобразовать файл CSV в DataFrame Pandas с использованием Aspose.Cells. Далее давайте рассмотрим, как работать с файлами Excel, сначала сохраняя их в формате CSV, а затем загружая их в Pandas.
Преобразование Excel в DataFrame Pandas через CSV файл
Иногда ваши данные находятся в формате Excel (.xlsx или .xls), и вы хотите конвертировать Excel в DataFrame Pandas через CSV. Aspose.Cells делает это без труда.
Следуйте следующим шагам, чтобы преобразовать Excel в DataFrames Pandas через CSV-файл:
- Загрузите файл Excel в объект класса
Workbook. - Сохраните файл Excel в формате CSV.
- Перезагрузите вновь созданный CSV файл в рабочую книгу.
- Получите доступ к первому worksheet по его индексу.
- Извлеките все значения ячеек в список списков Python.
- Используйте первую строку в качестве заголовков столбцов, а остальное - в качестве строк данных.
- Создайте DataFrame Pandas из извлеченных данных.
- Print the results.
Следующий пример кода показывает, как преобразовать Excel в DataFrame pandas в Python:
import aspose.cells as ac
import pandas as pd
# Загрузите файл Excel
excel_wb = ac.Workbook("PandasTest.xlsx")
# Сохранить Excel как CSV
excel_wb.save("converted.csv", ac.SaveFormat.CSV)
# Перезагрузите CSV с помощью Aspose.Cells
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]
# Извлечь данные из CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# Преобразовать в DataFrame Pandas
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())

Пример файла Excel для преобразования в DataFrame Pandas через CSV.
Output
Product A Product B Period
0 50 160 Q1
1 100 32 Q2
2 170 50 Q3
3 300 40 Q4
Работа с большими CSV файлами
Для очень больших наборов данных Aspose.Cells обрабатывает память лучше, чем обычный Pandas. Вы даже можете включить оптимизацию памяти. Следуйте тем же шагам, что и ранее. Единственное изменение заключается в загрузке CSV-файла с помощью LoadOptions и установке MEMORYPREFERENCE для эффективной обработки больших файлов.
Следующий пример кода показывает, как преобразовать большой CSV-файл в DataFrame pandas в Python:
import aspose.cells as ac
import pandas as pd
# Загрузите большой CSV файл с помощью Aspose.Cells
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]
# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# Конвертировать в DataFrame Pandas
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())
Это делает импорт CSV в Pandas более эффективным в дата-пайплайнах.
Получите бесплатную лицензию
Попробуйте Aspose.Cells for Python сегодня, чтобы улучшить преобразования CSV в DataFrame Pandas. Download бесплатную версию или get a temporary license, чтобы исследовать все возможности без ограничений.
CSV to DF: Дополнительные бесплатные ресурсы
Вы можете использовать ресурсы ниже, чтобы узнать больше о импорте CSV, преобразовании DataFrame и других функциях обработки Excel и CSV, доступных в Aspose.Cells for Python.
Заключение
В этом руководстве вы узнали, как загружать CSV файлы напрямую в Aspose.Cells и преобразовывать их в Pandas DataFrames, а также как сохранять Excel файлы в формате CSV перед их импортом. Вместе с Pandas, Aspose.Cells предоставляет вам больший контроль, производительность и гибкость, делая ваши задачи обработки данных более надежными и масштабируемыми.
Если у вас есть вопросы или вам нужна помощь, пожалуйста, посетите наш free support forum.Наша команда поддержки готова помочь вам.
