うまい寿司が食いたい。

うまい寿司が遠慮なく食べれるようになるまで,進捗とか垂れ流すブログ

2018-11-01から1ヶ月間の記事一覧

Dask メモリにのらない大規模なcsvデータの取扱について

Dask? 大規模なデータセットの並列処理用のライブラリ なんで必要? この記事を書いている時点(2018/11/11)で,kaggleのkernelのメモリが17.2Gしかないので,10Gぐらいあるcsvを読み込もうとすると,メモリエラーが起きます。 これを回避する方法として,pan…

pandasの前処理で使っているもの自分用まとめ

どんな記事? pandasの前処理で使ったことのあるmethodの書いているウェブページなどをまとめていく記事。 用途は自分用。 どんどん追加していく(予定) 基本的に 前処理大全[データ分析のためのSQL/R/Python実践テクニック]作者: 本橋智光出版社/メーカー:…