リンク > ITメモ > Python Pandas

Pandas備忘録

csvファイルの読み書き

読み込み

df = pd.read_csv(data, delimiter=',' header=None, names=(a, b, c, ...), index_col=0)

csvファイルへの書き出し

df.to_csv(file_name, 'sep', index=false, header=false)

インデックス

特定のインデックスのデータにアクセス

df.loc['str'] # 特定のラベルのデータを取得
df.iloc['int'] # 特定の行列番号のデータを取得
df['condition'] # 特定の条件を満たすデータを取得.
                  # 複数の条件を書く場合はnp.logicalなどを使う.

インデックス操作

index_list = df.index # インデックスの取得
df.set_index(index_list, inplace=True) # インデックスの設定
                                         # inplace=Trueのときは上書き

データ変換

Pandas DataFrameからnumpy arrayへ変換

df.values

データ操作

ソート

df.sort_values(ascending=False) # ascending=Falseで降順

インデックスを振り直す

df.reset_index(drop=True) # drop=Trueで元のインデックスのカラムを削除

参考リンク