CSVファイルを扱うことは、データアナリストや開発者にとって日常的な作業です。CSVをPandas DataFrameに変換する必要がある場合、Pandasは直接readcsv()
関数を提供していますが、時にはもっと強力な機能が必要です。そこで、Aspose.Cells for Pythonの出番です。Aspose.Cellsを使用すると、Excelフォーマットとの互換性、より良い制御、信頼性を確保しながら、PandasにCSVをインポートできます。このブログ記事では、CSVをPandasに変換し、Excelファイルを扱い、それらをPandas DataFrameにエクスポートする方法をステップバイステップで学びます。
最終的には、CSVからDataFrame Pandasに素早く効率的に移行する複数の方法を知ることができるでしょう。
CSVをPandas DataFrameに変換するためのPythonライブラリ
Aspose.Cells for Python via .NET は、スプレッドシートで作業するための強力なライブラリです。これを使用すると、Microsoft Excelを必要とせずに、ExcelおよびCSVファイルをプログラム的に作成、読み取り、編集、変換できます。CSVからPandasへの変換を行う際に、Aspose.Cellsは、生のCSVファイルと構造化されたPandas DataFrameとの間の信頼できる橋渡し役を果たします。
前提条件
次の例を実行する前に、以下がインストールされていることを確認してください:
- Aspose.Cells for Python via .NET: リリースからダウンロード または pip でインストール:
pip install aspose-cells-python
- Pandas – pipを使ってインストールする:
pip install pandas
これらの2つのライブラリを使用すると、Aspose.Cellsを使用してCSV/Excelファイルをロードし処理し、その後、分析のためにPandas DataFrameに変換することができます。
Aspose.Cells for Python via .NET → CSV/Excelファイルの読み取りおよび処理用。
Pandas → データフレームの構築と分析のため。
CSVをPandas DataFrameに変換する: ステップバイステップ
このセクションでは、Aspose.Cells for Pythonを使用してCSVファイルをPandas DataFrameに変換する完全なプロセスを説明します。各ステップは小さなタスクに分かれています。これにより、簡単に理解できます。最初にCSVをワークブックにロードし、その内容を抽出してPandas DataFrameを構築します。
ステップ 1: CSVをワークブックに読み込む
CSVファイルをAspose.Cellsワークブックに読み込むことから始めましょう。
- Workbookクラスをインポートします。
- CSVファイルを読み込んでください。
- 最初のワークシートにアクセスします。
import aspose.cells as ac
# Load CSV file into Workbook
csv_wb = ac.Workbook("data.csv")
# Access the first worksheet (CSV loads as sheet)
csv_ws = csv_wb.worksheets[0]
ステップ 2: ワークシートからデータを抽出する
ファイルがロードされると、その内容を行ごとに抽出します。これにより、データがDataFrameへの変換のために準備されます。
- セルコレクションを取得します。
- 行と列をループします。
- リストのリストに値を格納します。
cells = csv_ws.cells
# Extract CSV data into Python list
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
ステップ 3: CSVをPandas DataFrameに変換する
今、抽出したリストをPandas DataFrameに変換します。このステップでは、ヘッダーを適切に持つCSVからPandas DataFrameに移行する方法を示します。
- インポート パンダス。
- 最初の行をヘッダーとして使用してください。
- 残りの行からDataFrameを作成します。
import pandas as pd
# Convert to Pandas DataFrame
headers = data[0] # First row as header
rows = data[1:] # Remaining rows as data
df = pd.DataFrame(rows, columns=headers)
print(df.head())
あなたは今、Aspose.Cellsを使用してCSVをDataFrame Pandasに成功裏に変換しました。
これらのステップで、CSVファイルをAspose.Cellsを使用してPandas DataFrameに変換する方法を見てきました。次に、ExcelファイルをCSVとして保存し、それをPandasにロードする方法を見ていきましょう。
ExcelをCSVファイルを介してPandas DataFrameに変換する
時々、データがExcel形式(.xlsxまたは.xls)であり、ExcelをCSV経由でPandas DataFrameに変換したいことがあります。Aspose.Cellsは、これをシームレスに行います。
以下の手順に従って、ExcelをCSVファイル経由でPandas DataFrameに変換してください:
Workbook
クラスオブジェクトに Excel ファイルをロードします。- ExcelファイルをCSVとして保存します。
- 新しく作成されたCSVファイルをワークブックに再読み込みします。
- 最初のワークシートにインデックスでアクセスします。
- すべてのセルの値をPythonのリストのリストに抽出します。
- 最初の行を列のヘッダーとして使用し、残りをデータ行として使用します。
- 抽出したデータからPandas DataFrameを作成します。
- Print the results.
以下のコード例は、PythonでExcelをpandas DataFrameに変換する方法を示しています:
import aspose.cells as ac
import pandas as pd
# Excelファイルをロードする
excel_wb = ac.Workbook("PandasTest.xlsx")
# ExcelをCSVとして保存する
excel_wb.save("converted.csv", ac.SaveFormat.CSV)
# Aspose.Cellsを使用してCSVを再読み込みする
csv_wb = ac.Workbook("converted.csv")
csv_ws = csv_wb.worksheets[0]
# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# Pandas DataFrameに変換する
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())

CSVを介してPandas DataFrameに変換するためのサンプルExcelファイル。
Output
Product A Product B Period
0 50 160 Q1
1 100 32 Q2
2 170 50 Q3
3 300 40 Q4
大きなCSVファイルの操作
非常に大きなデータセットの場合、Aspose.Cellsは通常のPandasよりもメモリ処理が優れています。メモリ最適化を有効にすることもできます。以前と同じ手順に従ってください。唯一の変更点は、LoadOptions
を使用してCSVファイルをロードし、大きなファイルを効率的に処理するためにMEMORYPREFERENCE
を設定することです。
以下のコード例は、大きなCSVファイルをPythonのpandas DataFrameに変換する方法を示しています。
import aspose.cells as ac
import pandas as pd
# Aspose.Cellsを使用して大きなCSVファイルをロードします。
options = ac.LoadOptions()
options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE
csv_wb = ac.Workbook("large_file.csv", options)
csv_ws = workbook.worksheets[0]
# Extract data from CSV
cells = csv_ws.cells
data = []
for row_idx in range(cells.min_data_row, cells.max_data_row + 1):
row_data = []
for col_idx in range(cells.min_data_column, cells.max_data_column + 1):
row_data.append(cells.get(row_idx, col_idx).value)
data.append(row_data)
# Pandas DataFrameに変換する
headers = data[0]
rows = data[1:]
df = pd.DataFrame(rows, columns=headers)
# Show results
print(df.head())
これにより、PandasでのCSVのインポートがデータパイプラインでより効率的になります。
無料ライセンスを取得する
今日、Aspose.Cells for Pythonを試して、CSVからPandas DataFrameへの変換を強化してください。 Download 無料トライアルをダウンロードするか、 get a temporary license を取得して、制限なしにすべての機能を探索してください。
CSV to DF: 追加の無料リソース
以下のリソースを使用して、Aspose.Cells for Pythonで利用できるCSVインポート、DataFrame変換、その他のExcelおよびCSV処理機能について詳しく調べることができます。
結論
このガイドでは、CSVファイルを直接Aspose.Cellsにロードし、それをPandasのDataFrameに変換する方法や、インポート前にExcelファイルをCSVとして保存する方法について学びました。Pandasと組み合わせることで、Aspose.Cellsはデータ処理タスクをより信頼性が高く、スケーラブルにするための大きな制御、パフォーマンス、柔軟性を提供します。
質問がある場合やサポートが必要な場合は、ぜひ私たちの free support forum を訪れてください。私たちのサポートチームはあなたを支援するために利用可能です。