Работа с CSV файлами является ежедневной задачей для аналитиков данных и разработчиков. Если вам нужно преобразовать CSV в Pandas DataFrame, Pandas предоставляет прямую функцию readcsv(), но иногда вам нужна больше мощность. Вот где наступает Aspose.Cells for Python. С помощью Aspose.Cells вы можете импортировать CSV в Pandas, обеспечивая лучшее управление, надежность и совместимость с форматами Excel. В этом блоге вы узнаете пошагово, как преобразовать CSV в Pandas, работать с Excel файлами и экспортировать их в Pandas DataFrames.

К концу вы узнаете несколько способов быстро и эффективно перейти от CSV к DataFrame Pandas.

Библиотека Python для преобразования CSV в DataFrame Pandas

Aspose.Cells for Python через .NET является мощной библиотекой для работы с электронными таблицами. Она позволяет вам программно создавать, читать, редактировать и конвертировать файлы Excel и CSV без необходимости в Microsoft Excel. При работе с конверсиями CSV в Pandas Aspose.Cells действует как надежный мост между сырыми CSV файлами и структурированными Pandas DataFrame.

Предварительные требования

Перед запуском примеров убедитесь, что у вас установлено следующее:

pip install aspose-cells-python
  • Pandas – установить с помощью pip:
pip install pandas

Эти две библиотеки позволят вам загружать и обрабатывать файлы CSV/Excel с помощью Aspose.Cells, а затем преобразовывать их в DataFrame Pandas для анализа.

Aspose.Cells for Python через .NET → для чтения и обработки файлов CSV/Excel.

Pandas → для построения и анализа DataFrame.

Преобразуйте CSV в DataFrame Pandas: Шаг за шагом

В этом разделе вы пройдете через полный процесс преобразования CSV-файла в DataFrame Pandas с помощью Aspose.Cells for Python. Каждый этап разбит на небольшие задачи. Это облегчает вам следование. Вы начнете с загрузки CSV в рабочую книгу. Извлеките его содержимое и создайте DataFrame Pandas.

Шаг 1: Загрузите CSV в книгу.

Давайте начнем с загрузки файла CSV в рабочую книгу Aspose.Cells.

  1. Импортируйте класс Workbook.
  2. Загрузите файл CSV.
  3. Доступ к первому листу.
import aspose.cells as ac

# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")

# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]

Шаг 2: Извлечение данных из рабочей книги

Как только файл загружен, извлеките его содержимое строка за строкой. Это подготавливает данные для конверсии в DataFrame.

  1. Получите сбор клеток.
  2. Перебирать строки и столбцы.
  3. Храните значения в списке списков.
cells = csv_ws.cells

# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

Шаг 3: Преобразуйте CSV в DataFrame Pandas

Теперь преобразуйте извлеченный список в DataFrame Pandas. Этот шаг демонстрирует, как перейти от CSV к DataFrame Pandas с правильными заголовками.

  1. Импортируйте Pandas.
  2. Используйте первый ряд в качестве заголовков.
  3. Создайте DataFrame из оставшихся строк.
import pandas as pd

# Convert to Pandas DataFrame
headers = data[0]   # First row as header
rows = data[1:]     # Remaining rows as data

df = pd.DataFrame(rows, columns=headers)

print(df.head())

Вы успешно преобразовали CSV в DataFrame Pandas с использованием Aspose.Cells.

С этими шагами вы увидели, как преобразовать файл CSV в DataFrame Pandas с использованием Aspose.Cells. Далее давайте рассмотрим, как работать с файлами Excel, сначала сохраняя их в формате CSV, а затем загружая их в Pandas.

Преобразование Excel в DataFrame Pandas через CSV файл

Иногда ваши данные находятся в формате Excel (.xlsx или .xls), и вы хотите конвертировать Excel в DataFrame Pandas через CSV. Aspose.Cells делает это без труда.

Следуйте следующим шагам, чтобы преобразовать Excel в DataFrames Pandas через CSV-файл:

  1. Загрузите файл Excel в объект класса Workbook.
  2. Сохраните файл Excel в формате CSV.
  3. Перезагрузите вновь созданный CSV файл в рабочую книгу.
  4. Получите доступ к первому worksheet по его индексу.
  5. Извлеките все значения ячеек в список списков Python.
  6. Используйте первую строку в качестве заголовков столбцов, а остальное - в качестве строк данных.
  7. Создайте DataFrame Pandas из извлеченных данных.
  8. Print the results.

Следующий пример кода показывает, как преобразовать Excel в DataFrame pandas в Python:

import aspose.cells as ac
import pandas as pd

# Загрузите файл Excel
excel_wb = ac.Workbook("PandasTest.xlsx")

# Сохранить Excel как CSV
excel_wb.save("converted.csv", ac.SaveFormat.CSV)

# Перезагрузите CSV с помощью Aspose.Cells
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]

# Извлечь данные из CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

# Преобразовать в DataFrame Pandas
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)

# Show results
print(df.head())
Преобразуйте Excel в DataFrame Pandas с помощью CSV

Пример файла Excel для преобразования в DataFrame Pandas через CSV.

Output

   Product A  Product B Period
0         50        160     Q1
1        100         32     Q2
2        170         50     Q3
3        300         40     Q4

Работа с большими CSV файлами

Для очень больших наборов данных Aspose.Cells обрабатывает память лучше, чем обычный Pandas. Вы даже можете включить оптимизацию памяти. Следуйте тем же шагам, что и ранее. Единственное изменение заключается в загрузке CSV-файла с помощью LoadOptions и установке MEMORYPREFERENCE для эффективной обработки больших файлов.

Следующий пример кода показывает, как преобразовать большой CSV-файл в DataFrame pandas в Python:

import aspose.cells as ac
import pandas as pd

# Загрузите большой CSV файл с помощью Aspose.Cells
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]

# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

# Конвертировать в DataFrame Pandas
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)

# Show results
print(df.head())

Это делает импорт CSV в Pandas более эффективным в дата-пайплайнах.

Получите бесплатную лицензию

Попробуйте Aspose.Cells for Python сегодня, чтобы улучшить преобразования CSV в DataFrame Pandas. Download бесплатную версию или get a temporary license, чтобы исследовать все возможности без ограничений.

CSV to DF: Дополнительные бесплатные ресурсы

Вы можете использовать ресурсы ниже, чтобы узнать больше о импорте CSV, преобразовании DataFrame и других функциях обработки Excel и CSV, доступных в Aspose.Cells for Python.

Заключение

В этом руководстве вы узнали, как загружать CSV файлы напрямую в Aspose.Cells и преобразовывать их в Pandas DataFrames, а также как сохранять Excel файлы в формате CSV перед их импортом. Вместе с Pandas, Aspose.Cells предоставляет вам больший контроль, производительность и гибкость, делая ваши задачи обработки данных более надежными и масштабируемыми.

Если у вас есть вопросы или вам нужна помощь, пожалуйста, посетите наш free support forum.Наша команда поддержки готова помочь вам.

Смотрите также