Робота з файлами CSV є щоденним завданням для аналітиків даних та розробників. Якщо вам потрібно конвертувати CSV в Pandas DataFrame, Pandas надає пряму функцію readcsv(), але іноді вам потрібна більше можливостей. Саме тут на допомогу приходить Aspose.Cells for Python. За допомогою Aspose.Cells ви можете імпортувати CSV в Pandas, забезпечуючи кращий контроль, надійність та сумісність з форматами Excel. У цьому блозі ви дізнаєтеся крок за кроком, як конвертувати CSV в Pandas, працювати з файлами Excel та експортувати їх у Pandas DataFrames.

До кінця ви дізнаєтеся кілька способів швидко і ефективно перетворити CSV у DataFrame Pandas.

Бібліотека Python для перетворення CSV в DataFrame Pandas

Aspose.Cells for Python via .NET - це потужна бібліотека для роботи з електронними таблицями. Вона дозволяє вам створювати, читати, редагувати та конвертувати файли Excel та CSV програмним чином без необхідності в Microsoft Excel. При роботі з конверсіями CSV в Pandas Aspose.Cells виступає надійним мостом між сирими CSV-файлами та структурованими DataFrame-ами Pandas.

Передумови

Перед тим, як запустити приклади, переконайтеся, що у вас встановлено наступне:

pip install aspose-cells-python
  • Pandas – встановлення з pip:
pip install pandas

Ці дві бібліотеки дозволять вам завантажувати і обробляти CSV/Excel файли за допомогою Aspose.Cells, а потім конвертувати їх у Pandas DataFrames для аналізу.

Aspose.Cells for Python через .NET → для читання та обробки CSV/Excel файлів.

Pandas → для створення та аналізу DataFrames.

Перетворення CSV в DataFrame Pandas: Крок за Кроком

У цьому розділі ви пройдете через повний процес перетворення файлу CSV у DataFrame Pandas за допомогою Aspose.Cells for Python. Кожен крок поділений на невеликі завдання. Це полегшує вам слідування. Ви почнете з завантаження CSV у робочий зошит. Витягніть його вміст і побудуйте DataFrame Pandas.

Крок 1: Завантажте CSV у робочу книгу

Давайте почнемо з завантаження CSV файлу в робочий зошит Aspose.Cells.

  1. Імпортуйте клас Workbook.
  2. Завантажте файл CSV.
  3. Отримайте перший аркуш.
import aspose.cells as ac

# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")

# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]

Крок 2: Екстракт дані з аркуша

Як тільки файл буде завантажено, витягніть його вміст рядок за рядком. Це підготував дані для перетворення на DataFrame.

  1. Отримайте колекцію комірок.
  2. Перебирать рядки та стовпці.
  3. Сховати значення в списку списків.
cells = csv_ws.cells

# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

Крок 3: Конвертуйте CSV у DataFrame Pandas

Тепер перетворіть витягнутий список у Pandas DataFrame. Цей крок показує, як перейти з CSV до Pandas DataFrame з правильними заголовками.

  1. Import Pandas.
  2. Використовуйте перший ряд як заголовки.
  3. Створіть DataFrame з решти рядків.
import pandas as pd

# Convert to Pandas DataFrame
headers = data[0]   # First row as header
rows = data[1:]     # Remaining rows as data

df = pd.DataFrame(rows, columns=headers)

print(df.head())

Ви тепер успішно перетворили CSV на DataFrame Pandas за допомогою Aspose.Cells.

З цими кроками ви побачили, як перетворити файл CSV у DataFrame Pandas за допомогою Aspose.Cells. Далі давайте розглянемо, як працювати з файлами Excel, спочатку зберігаючи їх як CSV, а потім завантажуючи їх у Pandas.

Перетворіть Excel в DataFrame Pandas за допомогою CSV-файлу

Іноді ваші дані знаходяться у форматі Excel (.xlsx або .xls), і ви хочете перетворити Excel у DataFrame Pandas через CSV. Aspose.Cells робить це безперешкодним.

Слідуйте наведеним крокам, щоб конвертувати Excel в Pandas DataFrames через CSV файл:

  1. Завантажте файл Excel у клас об’єкта Workbook.
  2. Збережіть файл Excel як CSV.
  3. Перезавантажте новостворений CSV файл у книгу.
  4. Отримайте доступ до першого аркуша за його індексом.
  5. Extract all cell values into a Python list of lists.
  6. Використовуйте перший ряд як заголовки стовпців, а решту - як ряди даних.
  7. Створіть DataFrame Pandas з витягнених даних.
  8. Print the results.

Наступний приклад коду показує, як конвертувати Excel в DataFrame pandas в Python:

import aspose.cells as ac
import pandas as pd

# Завантажте файл Excel
excel_wb = ac.Workbook("PandasTest.xlsx")

# Зберегти Excel як CSV
excel_wb.save("converted.csv", ac.SaveFormat.CSV)

# Перезавантажити CSV з Aspose.Cells
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]

# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

# Convert to Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)

# Show results
print(df.head())
Конвертуйте Excel в DataFrame Pandas через CSV

Sample Excel file for converting into a Pandas DataFrame via CSV.

Output

   Product A  Product B Period
0         50        160     Q1
1        100         32     Q2
2        170         50     Q3
3        300         40     Q4

Робота з великими CSV файлами

Для дуже великих наборів даних Aspose.Cells краще обробляє пам’ять, ніж звичайний Pandas. Ви навіть можете активувати оптимізацію пам’яті. Виконайте такі ж кроки, як раніше. Єдина зміна полягає в тому, щоб завантажити CSV файл з LoadOptions та встановити MEMORYPREFERENCE, щоб ефективно обробляти великі файли.

Наступний приклад коду показує, як конвертувати великий CSV файл у pandas DataFrame на Python:

import aspose.cells as ac
import pandas as pd

# Завантажте великий CSV файл з Aspose.Cells
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]

# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
    row_data = []
   for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
        row_data.append(cells.get(row_idx, col_idx).value)
    data.append(row_data)

# Convert to Pandas DataFrame
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)

# Show results
print(df.head())

Це робить імпорт CSV в Pandas більш ефективним у дата-пайплайнах.

Отримайте безкоштовну ліцензію

Спробуйте Aspose.Cells for Python сьогодні, щоб покращити перетворення CSV в Pandas DataFrame. Download безкоштовну версію або get a temporary license, щоб дослідити всі можливості без обмежень.

CSV to DF: Додаткові безкоштовні ресурси

Ви можете використовувати ресурси нижче, щоб дізнатися більше про імпорт CSV, конвертацію DataFrame та інші функції обробки Excel і CSV, доступні в Aspose.Cells for Python.

Висновок

В цьому посібнику ви дізналися, як завантажувати CSV файли безпосередньо в Aspose.Cells і перетворювати їх у Pandas DataFrames, а також як зберігати Excel файли у форматі CSV перед їх імпортом. Разом з Pandas, Aspose.Cells дає вам більший контроль, продуктивність і гнучкість, роблячи ваші завдання обробки даних більш надійними та масштабованими.

Якщо у вас є які-небудь питання або вам потрібна допомога, будь ласка, відвідайте наш безкоштовний форум підтримки.Наша команда підтримки завжди готова вам допомогти.

Дивіться також