St_Hakky’s blog

心理学/人事/就活/留学/データサイエンス/バイオインフォマティクス/日頃思ったことについて書きます。

Kaggleを始める際に知っておくべきTipsをまとめてみた

こんにちは。

今パソコンがぶっ壊れて絶賛セットアップ中なんですが、Kaggleの準備するがてらまとめておこうかと。

【Kaggleを始めるにあたって知っておくべきことリスト】

・Kaggleとは
・Kaggleのアカウントの作成
コンペティションを選んで参加する
・Kaggle CLI
・Kaggle上位者達の知見を得る

上のような感じで書きます。

○Kaggleとは

データ分析のコンペティションです(いろんなサイトがめっちゃ説明しているので割愛笑)。最近、KaggleがGoogleに買収されたとかで話題になっていましたね。

○Kaggleのアカウント作成

作らなきゃ始まらない。以下からアカウントを作ります。

www.kaggle.com

コンペティションを選んで参加する。

やらなきゃ始まらない。いろんなコンペティションがあるので適当に面白そうなのを見て参加します。

僕はやっていませんが、一番最初はタイタニックとかが良いようですね。このあたりはいろんなサイトが紹介しているのでそれを見たほうが早いかと。

あとは、目的にもよるんですが、最初はトップの人たちがどんなふうにやっているのかを知るのが良いと思うので、後述するインタビュー記事とかで詳しめのやつとかからやるのがいいのかもしれないっす(ってか自分はそうしている)。

○Kaggle CLI

Kaggleのサブミッションとかまぁ割りと面倒なんで、ふつうにCLIから操作するためのものが用意されています。最強たちは、AWSとか使ってやるみたいですが(学生身分だとそれ相応のスペック容易しようとすると金たりねぇからそんなこと個人でしないけど笑)、そんな時に使うと便利みたいですね。


インストール方法は、以下の通りpipで入ります。

pip install kaggle-cli
kg config -g -u `username` -p `password` -c `competition`

このコマンドを打ったあとに、ブラウザから、、、、大事なので2回言います。ブラウザから、Kaggleのサイトにログイン後、コンペティションサイトに行って、コンペティションの規約に同意する的なことをしないといけません(いや、それもコマンドからさせろよという)。

その他のお役立ちコマンドはこちらから見れます。データセットのダウンロードから、提出までできるようですね。便利。

○Kaggle上位者達の知見を得る

まずは、Kaggleのオフィシャルブログ。見ているだけで勉強になる。

blog.kaggle.com

上のサイトの中に、kaggleのコンペティションで勝った人のインタビューが載っている。