こんにちは*1。
Kaggle、熱いですね!
Kaggleのコンペなんか参加しようと思ってKaggleサイトをぱらぱら眺めてるんだけど、これカーネルとか眺めてるだけで、下手なところよりも普通に勉強できちゃうな笑
— Hakky@Julia勉強中(´・∀・) (@St_Hakky) 2017年11月14日
知見の塊すぎるKaggleをやっていくにあたって、準備するがてらまとめておこうかと。
Kaggleを始めるにあたって知っておくべきことリスト
以下の内容についてつらつらと書いていこうと思います。
- Kaggleとは
- Kaggleのアカウントの作成
- コンペティションを選んで参加する
- Kaggle CLI
- Kaggle上位者達の知見を得る
上のような感じで書きます。
[2017/10/05追記] 以下のサイトにKaggleのリンク集がありました。
Kaggleとは
データ分析のコンペティションです(いろんなサイトがめっちゃ説明しているので割愛笑)。最近、KaggleがGoogleに買収されたとかで話題になっていましたね。
コンペティションを選んで参加する。
やらなきゃ始まらない。いろんなコンペティションがあるので適当に面白そうなのを見て参加します。
私はやっていませんが、一番最初はタイタニックとかが良いようですね。このあたりはいろんなサイトが紹介しているのでそれを見たほうが早いかと。
あとは、目的にもよるんですが、最初はトップの人たちがどんなふうにやっているのかを知るのが良いと思うので、後述するインタビュー記事とかで詳しめのやつとかからやるのがいいのかもしれないっす*2。
参加すればわかることが本当に多いので、「どれにしよっかなー」とかで悩んでいるのではなくて、とりあえずなんでもいいので初めて見るのがいいと思います。
■参考資料
Kaggle CLI
Kaggleのサブミッションとかまぁ割りと面倒なんで、ふつうにCLIから操作するためのものが用意されています。最強たちは、AWSとか使ってやるみたいですが(学生身分だとそれ相応のスペック容易しようとすると金たりねぇからそんなこと個人でしないけど笑)、そんな時に使うと便利みたいですね。
インストール方法は、以下の通りpipで入ります。
$ pip install kaggle-cli $ kg config -g -u `username` -p `password` -c `competition`
このコマンドを打ったあとに、ブラウザから、、、、大事なので2回言います。ブラウザから、Kaggleのサイトにログイン後、コンペティションサイトに行って、コンペティションの規約に同意する的なことをしないといけません(いや、それもコマンドからさせろよという)。
その他のお役立ちコマンドはこちらから見れます。データセットのダウンロードから、提出までできるようですね。便利。
Kaggle上位者達の知見を得る
まずは、Kaggleのオフィシャルブログ。見ているだけで勉強になます。
上のサイトの中に、kaggleのコンペティションで勝った人のインタビューが載っています。
また、以下のyoutube動画では、実際にKaggleをやっている様子を解説しているので、これも凄い参考になります。
この動画を解説されている方が開いた日本のKagglerが集まったslackがあります。
以下の私のツイートにあるように、知見の塊すぎてやばいので、Kaggleやりたい方はぜひ参加されることをおすすめします*3
日本のデータサイエンスの人たちが集まっているKaggleのslack見てるんだけど、なんかだれかが質問したらさいつよと思われる人(あったことがないのであの人がこの人って想像つかないけどアイコンとかで何となく)が、さりげなく答えているのにビビっている笑
— Hakky@Julia勉強中(´・∀・) (@St_Hakky) 2017年12月28日