うまい寿司が食いたい。

うまい寿司が遠慮なく食べれるようになるまで,進捗とか垂れ流すブログ

pandasの前処理で使っているもの自分用まとめ

どんな記事?

pandasの前処理で使ったことのあるmethodの書いているウェブページなどをまとめていく記事。
用途は自分用。

どんどん追加していく(予定)

基本的に

に載ってそう。
ただ,外で突然調べたいときに,もう一度調べるのがめんどくさいので,時間があるときに少しずつ調べたmethodを書いておく。

列名をindexに変更する

set_index()

df.set_index("hoge")hogeがindex名に変わる。

note.nkmk.me

index名でmergeする。

pppurple.hatenablog.com

が詳しい。

mergeだったり,joinだったりする。

pandasの公式

pandas.DataFrame.join — pandas 0.23.4 documentation

を見たけど,nanを自動的にドロップする引数はないので,必要があればdropna()を使う。

dropna()

dropna()は列であれば,axisを指定しなくてもよいが,あとで読む人がわかりやすいように,axis=0と明示的に書いておいたほうが良さそう。
また,inplace=Trueを入れておくことで

df = df.dropna(axis=0, how=`any`)

と自分に代入していたのを,

df.dropna(axis=0, how=`any`, inplace=True)

と代入しなくてもよくなるので,このほうがわかりやすいだろう(ほんとか?)

reset_index()

unstackしたりしたときに,multicolumnsになったりするので,インデックスをリセットしてくれる。
multi columnsになったら,columnsがdataframeのnameになったりするので,それはどうにかできないか不明。

www.geeksforgeeks.org

intoli.com