St_Hakky’s blog

心理学/人事/就活/留学/データサイエンス/バイオインフォマティクス/日頃思ったことについて書きます。

データサイエンティストとは何か今一度考える - 3

こんにちは。

僕が就活をしていて感じたことと、少し前の記事で以下の記事があったので、これらについて肌感覚として思っていることを書きます(なので間違っている可能性などは十分にアリエル)。

tjo.hatenablog.com

僕の好きなTJOさんのブログですね笑。いつもTwitterとかも楽しくみています笑。

○データサイエンティストを自社で持っている会社の仕組み

僕は就活をしていて感じたのが、確実に「少数精鋭のプロフェッショナル集団」として扱っているか、「完璧超人となったデータサイエンティストの要件を満たせる奴はいないと思い、それを分割して役割分担の上、組織を作っている」か、が現状だということです。なので、新卒でとっているところはよほど大手の10年後を見据えた形のところか、研究職系か、バイオ・薬学系となります。

2013年くらいにあった「データサイエンティストが今後25万人必要になる」みたいなのはないと思いますし、むしろ雇用の窓口として今後もそんなに大きくならないと思います。

www.slideshare.net

上の資料はかなり丁寧にまとまっていますし、かなりわかりやすい。

僕の感じるところで行くと、
・求めるスキルセットが高いので給与が高くなり、
・そもそも全部を網羅できる人が少なく、また自動化できる部分が多いので、
・少数精鋭部隊にして社全体のプロジェクトを見るか、分割して事実上成り立たせるか、
になって来ていると思われます。

○なぜデータ/人工知能技術が重要と言われつつまだやっている企業が少ないのか

これもかなり就活を通して思っています。大手のITと言われるところですら、まだまだな状態なので、こちとらびっくら仰天みたいな感じです。

理由としては、以下の資料が参考になるかと思います。

www.slideshare.net

これはまだ業務をちょっとしかみていない僕でもかなり感じますね。。。笑

以下が僕も感じている部分。

・データで分析した結果、びっくり仰天なものなんてそうそう生まれない
・重要性に対して、結果が未知な部分が多く、投資してくれない
・統計とか複雑に絡みすぎてて、わてはよーわからんって人が多い
・そもそもデータをくれない問題

なので、データを基にして事業を組み立てれて、開発の方針なども全て自前で建てられるレベル感のデータサイエンティスト、つまり、

Ph.D持ちで、Spark,Hadoop,SQLあたりは当然に使えて、Pythonが分析のみならずプロダクトに組み込むアルゴリズムの構築レベルでかけて、統計モデルと機械学習の知識が豊富で、ビジネス経験が十分で、チームマネジメントに長け、コミュニケーションの高い人 募集』
参考:そろそろデータサイエンティストの定義とスキルセットについて本気で考えてみる - Qiita

な人がいる場合か、データの重要性を理解して現実的な人物の要件分割に基づく組織づくりをしている会社か、委託に全面協力体制を敷く勇気のある会社しか、もうデータサイエンティストは活躍できないのかもしれない。

そういう意味で、スバズワードにはなってはいつつも、正直あんまり雇用が増えないのはそういうことなんじゃないかなぁという、今日この頃でした。