Pandas備忘録
csvファイルの読み書き
読み込み
df = pd.read_csv(data, delimiter=',' header=None, names=(a, b, c, ...), index_col=0)
csvファイルへの書き出し
df.to_csv(file_name, 'sep', index=false, header=false)
インデックス
特定のインデックスのデータにアクセス
df.loc['str'] # 特定のラベルのデータを取得
df.iloc['int'] # 特定の行列番号のデータを取得
df['condition'] # 特定の条件を満たすデータを取得.
# 複数の条件を書く場合はnp.logicalなどを使う.
インデックス操作
index_list = df.index # インデックスの取得
df.set_index(index_list, inplace=True) # インデックスの設定
# inplace=Trueのときは上書き
データ変換
Pandas DataFrameからnumpy arrayへ変換
df.values
データ操作
ソート
df.sort_values(ascending=False) # ascending=Falseで降順
インデックスを振り直す
df.reset_index(drop=True) # drop=Trueで元のインデックスのカラムを削除
参考リンク