読者です 読者をやめる 読者になる 読者になる

St_Hakky’s blog

心理学/人事/就活/留学/データサイエンス/バイオインフォマティクス/日頃思ったことについて書きます。

データサイエンティストとは何か今一度考える - 2

データサイエンス

こんにちは。なんか、「お前のいうデータサイエンティストってなんやねん」って言われて一言で説明するのが難しいので、ここに書いておこうと思います笑。

前編はこちら。

st-hakky.hatenablog.com

○10年後くらいまでは予想ができるけど、20年後はムズイから頑張る

最近思うこと。これはある。多分なんですが、10年後自分がどんな姿で活動しているかは、時代の最先端から外れることも覚悟すれば、ある程度固めて行動できると思う。今50代(40代後半もギリ)のおじさんたちは、これで逃げ切れる。間違いない。

ただ、20年後に20年前に考えたことを実現するのはほぼ不可能に近い。いくらカッコよく「俺は予想していた」みたいなこと言っても「いやいやいや」みたいな笑。

その意味で行くと、今考えているデータサイエンティストのスキルセットとして必要なものがいつ壊れるかもわからないけれど、学習スピードが明らかに早くなっている今、特にデータサイエンティストのスキルとして、身につけるべき分野は否応無しに広がって行くと思う。「ある程度」までは、多分10年前は1年かかっていたことがインターネットなどの影響で1ヶ月くらいで勉強できるようになっていると思うし。

これが加速して行くことがわかっているのならば、分野をある程度今のうちに広げておきつつ、専門性を高めることを意識することは大事だと思う。データサイエンティストで掛け算(異分野領域)をわかってできる人は今、中途採用などで採用されているわけだが、その人たちのスキルなどをみていると「なるほど〜」となるし、それなりの給与をもらって働いている。

しかし、おそらく後10年もすれば新卒で要求されるくらいのレベル感になっていると思う。実際、いまのエンジニアがそうなっていると思うし。

○広がるとすればどこまで行くか

今までであれば、
・データを前処理して、
・統計とか使って処理をして、
・可視化して意味を読み取って、
・どや!
とすればよかったが、これからは自動化やそれを組み込んでビジネスとしてPDCAなどを人間の補助としてやって行くのが当たり前になって行くと思う。

IoTとかでも、Googleがこの前発表したGoogle Homeを始め、Amazon Echoとかを見ると、アメリカでは普通にもう一般家庭にまできていて、それが世界に広がって行く。データプラットフォームを制覇することが次は大事とわかっているITの各社がこぞって金を使っていると思う。

そうなると、解析するのなんて当たり前、マイニングして価値を見出してビジネス還元するのは当たり前で、そこから自動化やデータを基軸にしたサービスを開発することが必要だし、データサイエンティストとしてはその辺りができるようになって行くと思う。とても楽しい嬉しい。

こうなると、データサイエンティストは分散処理や可視化といったソフトウェアエンジニアリングの側面や統計解析の手法、ビジネスを理解していることはもちろんのこと、機械学習(DeepLearning)とかはもう既に必須で、それに加えて自然言語処理や画像処理にも知見が必要と考える。もはや1スキルで見通せるビジネスは組み立てきれないのではないかなと思う。

切り分けや住み分け自体は実際の作業レベルになればできるけど、「ビジネスとしての可能性や現実性」を組み立てる段階のクリエイティブさと、マネジメント的な側面ではまだまだ人間のカンは大事だと思っていて、そういう役目を「データサイエンティスト」ができる時代がくるのではないかな、と思う。そういう部隊ができるのではないかなと思う。エンジニアがいまそうなっているように。

○とは言いつつも。

就活と実際のデータ解析を行っている現場をみると、「なるほど(曖昧にしている)」となる。データ解析とかはみんな必要だと思っているけど、やらないみたいな笑。専門性と学習コストが異常にこの分野はやっぱり高いのもあって、直近では取り組みきれないみたいなところがあるんだと思う。まずは研究所からとか、大企業のようにバックが多いところか、技術系のベンチャーかみたいな感じで始めている企業が多いなぁという。僕の進路もだいたいこんな感じでかんがえてみていますね笑。

2年前に就活でその話をした時に「んー」みたいなよくわからんみたいな会社が多かったけど、今話すと「やりたいんだけどねぇ」みたいな感じ。人事をちょっとだけかじった時に、「あぁこんなこともデータが取れればできるのに」と思うことが多かったし、それは作業時間やミスマッチを確実に削減するものだった。だから、メリットとして大きいはず。でも「できない」。「できない」ということは「できる人」は楽しいことができるということ。

まぁ難しいと言いつつも、昔はIT企業にウェブ作成とかを外部委託みたいな感じでやっていたのが、自社で内製化するようになったのと同じように、データサイエンスも同じようになると思う。その意味で、いま技術を持っておくことは確実に大事だと思うんだけどなぁと思う今日この頃でした。