なかなか刺激的な翻訳記事が出ていたようで。ちなみに本家版の原典記事はこちら。
大体こういう話をするとよく炎上するんですが(笑)、前々からデータサイエンティスト(カナ)の需給状況とかについては延々とこのブログでも論じてきているので、便乗して日本での国内事情に関する与太話でも書こうかと思います*1。
そもそも日本国内に「データサイエンティスト」と呼ばれるにふさわしい人材自体がほとんどいない
(from Wikimedia Commons)
いつも色々な人に「そもそもデータサイエンティストって日本にどれくらいいるんですか?」とよく聞かれるんですが、これについては最近業界内の友人知人と話す機会が何度かあり、「おそらく首都圏に100人程度」「残りの地域は不明だがごく少数」というのが概ねコンセンサスの得られている数字だと思います*2。
これは実際に上記記事で挙げたような要件を満たし、なおかつデータ分析に関わる勉強会にコンスタントに集まる人たちの人数とその顔ぶれを、特に継続的に参加している層にセグメントを切ってカウントすると、大体それぐらいになるといった性質の数字です*3。なので厳密に集計したわけではなく、勉強会にやってこない人たちのことも見ていないのでこれが正しいと言い切れるわけでもありませんが、個人的にはほぼほぼ実感に合っているのではないかと感じています。
そうすると、いかな「データサイエンティストが欲しい!」と個々の企業が言ったところで、その100人程度をみんなで奪い合うような構図にしかならないという実態があるわけです。一方で人数が少ない以上、ひとたびその100人がそれぞれ居心地の良い職場に一旦収まってしまうと*4、なかなか再びオープンにならないので、ますます彼らを採用する機会には恵まれないという。
データ分析に関するリテラシーの広がりに乏しい現状では、もちろん日本でも高度なデータ分析を要する仕事は少ない
しかしながら、そのようにデータサイエンティストと称されるデータ分析の専門家たちが増えない背景として、人材難とかいう以前にそもそもそれほどの高度なデータ分析を要する仕事が少ない、という現状があるように個人的には思われます。少なくとも業界内の友人知人から見聞する範囲では、「ビッグデータ」「データサイエンティスト」「人工知能」の各ブームが大ブレークした後ですら、そのような業務が急増したとはほとんど聞こえてきません。
その理由は極めて簡単で、要はこなすべき仕事=ビジネスを創出する側、即ち経営者からビジネスパーソンの層の大半において、特にデータ分析が求められているわけでもなくその意識も希薄だからです。もっと露骨に言えば、「そもそもビジネスの場にデータ分析のリテラシーが広まっていない以上データ分析の仕事自体が少ない」ということですね。この辺の事情を踏まえて元記事では
ニーズという問題もある。多くの企業には、博士号を取得しているデータサイエンティストにしか解決できないような大きく複雑なデータに関連する問題はない。多くの企業が抱えるデータの問題は、ずっと規模が小さい。高度な統計分析技術やプログラミングの知識がなくてもセルフサービス型BIツールを使うことでどうにかできるものだ。
と斬っていますが、実際そんなもんだろうというのが現場での実感です。最近のTableauやQlikViewの流行、根強いGoogle AnalyticsやSite Catalyst(現Adobe Analytics)の人気を考えれば、そして現実に多変量解析以上のデータ分析を求めなおかつその結果を理解できるビジネスパーソンが少ない現状では、いわゆるデータサイエンティストに解決が期待されるような問題をわざわざ解決してまで何かしようという現場も企業も少なかろうと考えざるを得ないです。
結果的に「データサイエンティスト」を募集する企業は少ないまま
そういうわけで、「首都圏全体でも100人ぐらいしかいなくて滅多に見つからないレア人材」を「別に現実には必要とも限らない高度なデータ分析業務のために」わざわざ募集する企業はどう見ても少なくて当たり前で、これはアメリカでも日本でもそれほど変わりません。試しに同じようにIndeedで日本語で「データサイエンティスト」と検索して求人を探してみれば分かりますが、数えるくらいしかヒットしないはずです。元記事では
単純にデータサイエンティストを雇用することに企業があまり価値を見だしていない可能性もある。さまざまスキルを持っていることから、データサイエンティストには高額な給与を支払わなければならないことが多い。コストの面で考えると、データエンジニアを1人と複数のビジネスアナリストで構成されるチームを雇用した方が理にかなっているのかもしれない。データエンジニアの職務は情報が流れる仕組みを整えることだ。そして、ビジネスアナリストは、質問を投げ掛けて解を得るセルフサービス型BIツールを使えることなどだ。
と言っていて、特にデータサイエンティストの給与が高騰しているアメリカ(というかベイエリア)では殊更それが顕著だろうと思うのですが、それほどデータサイエンティストが極端に高給取りというわけでもない日本*5でもそういう話はよく聞きます。
BIエンジニアやそれに類するエンジニアの募集はじわじわと広がり続けている
これはどちらかというと巷の求人サービスなど見ていても分からないことかもしれませんが、僕のところに毎週毎月掃いて捨てるほど舞い込んでくる首狩り賊のメールを見ていても感じる傾向です。即ち、いわゆるデータサイエンティストのスキル4要件の
から上の2つを削除した上で
↓↓↓↓↓
- システムインフラ構築・整備・運用の経験がある
- DB構築の経験がある
という別の2要件に差し替えた4要件を満たす(そして場合によってはRもPythonも出来なくても良いという)人材の求人が増えているようです。これは言い方を変えると「データ集計システムを作れるエンジニア」の募集みたいなものですが*6、実際そういう人材が求められているという雰囲気を感じています。入れ替わりに、統計モデリングや機械学習の知識を求められるような求人は減っている印象が強いです。
またこれに呼応するビジネス・アナリティクスの世界でも、どちらかというとSQLでDBをサクサク叩けて、欲しい時に欲しい集計結果を迅速に自分で手に入れることが出来て、高速で意思決定するPDCAサイクルを回せる人材が尊ばれているということを聞きます。「高度な分析が出来る人材少数よりも簡易な集計を迅速にこなせる人材多数」の方が時代のニーズに合っている、と言っても良いのかもしれません。
ならば高度なデータ分析を担える人材はどこへ行くのか?
業界内でボソボソと意見交換していると出てくるのが、なかなか微妙な感のある話ですが「普段はBIエンジニアとかDBエンジニアとかの仕事を粛々とやりつつ、高度なデータ分析が必要とされる仕事がやってくるのを待つ」という声。そして実際に意外とそういう人が多いんですよね。。。*7
もちろん、今のうちの現場含めゴリゴリ機械学習や統計モデリングを含め高度なデータ分析を駆使して業務を回しているところもありますが、企業社会全体の流れとしてはまさに「データサイエンティスト、雌伏の時」という印象を否めない今日この頃です。という、何とも後ろ向きな与太記事でした(汗)。