Hatena::ブログ(Diary)

shi3zの長文日記 RSSフィード

2015-02-12

ビッグデータは本当に必要か?

 祝日

 なんか久しぶりにラーメン食いたいなあと思って秋葉原の青島食堂に並んだ。

 青島食堂のラーメンはシンプルな生姜醤油ベースのスープなのだが、なぜか病みつきになる。


 子どもの頃はこれがこんなに美味しいとは気付かなかった。


 青島の行列は絶えることなく、おまけに日当りが悪く寒かった。


 僕は修理から帰って来たばかりのiPad miniで、本を読みながら寒さに耐えた。

 開いた本はこれだ

統計学が最強の学問である

統計学が最強の学問である


 もともと「教養としてのプログラミング講座」を書く時に、中央公論の編集者が「こういう本を作りたいんです」と言ってみせてきた本だ。


 統計学が最強。

 そうなのか。


 としか思わなかった。


 しかし先日、Excelも使えないし右クリックもできない大学院生と一緒にRの使い方を学んだ僕は、ちょっと統計学に興味を持ったところだった。


 試しに読んでみると、面白い。

 なんでもっと早く読まなかったのか、ちょっと後悔したくらいだ。


 というのも、この本のタイトルから想像していた内容は

 「○○の統計をとってみると××という事実が解る。どや?」という、統計マメ知識みたいな内容なのかと思っていた。


 しかし本書の著者は統計学の誤用によって引き起こされる嘘やデタラメな推測を指摘し、闇雲にビッグデータを管理するための仕組みを作り上げるSIerを攻撃する。


 「1%未満の精度が大事なときにだけ、ビッグデータは有効である、それ以外はサンプル調査でいい」


 「満足度をアンケートにとって円グラフにして見せても、何の意味もない」


 「購買者自身にCMを見たかというアンケートをとっても、意味がない。むしろ購買しなかった層にアンケートをとったとき、CMを見てる比率はより高いかもしれない」



 なるほど。


 僕自身はアンケートは答えるのもとるのも好きではないが、アンケートの答えの塊である「MCS Elemetns」というソフトを売ったりしたこともある。


 それを見るのはなかなか楽しい。


 アンケートは取り方と分析方法の両方を工夫しないと意味がない。


 そしてアンケートをとる場面というのは、社会生活の至る所にあるはずだ。

 たとえば国勢調査は全数調査によるアンケートだし、選挙だってそうだ。国会の議決だって広義のアンケートと言えるかもしれない。


 そしてアンケートの結果をどのように分析するかという視点が重要なのだ。

 結果の分析方法によってアンケートの設問自体が変わって来る。


 ただし、実際にそこまで考えて運用されているアンケートも分析結果もほとんど見たことがない。


 「なんとなく、何かが解ったような気がする」だけで、実際にどう対策すればいいのかわからないものが殆どだ。



 統計学の知識が無ければ、こうしたアンケートをとることも分析することも無駄である。

 アンケートは、簡単にグラフ化できてしまうのがさらに良くないのかもしれない。


 グラフまでできてしまうと「おお、なんか仕事したなー」って気分になってしまうのだ。


 だから僕はアンケートなんか役に立たないと思っていたし、いわゆる市場調査会社の調査もくだらないと思っていた。


 面白いのは、マッキンゼーが90年代に携帯電話にインターネット機能を提案しようとして、実際に携帯電話の利用者に「インターネット機能は必要か?」というアンケートをとったところ、「不要」と答えた人が90%以上いたということだ。


 なのに、このアンケート結果を持ってきて、なおiモードの開発計画はGoサインが出た。


 アンケート結果をどう分析するか、たとえば「不要」と思う人が90%居るということを、「インターネット機能が必要とされてない」と解釈するか、それとも「インターネット機能による恩恵が今の消費者には想像できていない」と解釈するか、の問題だ。


 もし、インターネット機能による恩恵が想像できていないのならば、そこに全く新しい市場を作ることが出来る可能性があることになる。


 iモード計画のGoが出た根拠は、想像するしかないが、たとえば「(1)携帯電話は数年で買い替えられる需要がある」「(2)しかしドコモは寡占状態であり、さらに利益を伸ばすには新サービスを販売する必要がある」「(3)新サービスとしてまだ恩恵が理解されていないインターネット機能を導入することで、全く新しい体験価値を提供できる」「(4)新機能は新しく販売する携帯電話全てに搭載し、消費者は自ら進んで選択しなくても(1)の理由から新機能のついた携帯電話に買い替え、やがて新サービスの恩恵に気付く」というロジックならば、アンケート結果を有効に活用したといえる。



 でも、これって屁理屈のように聞こえなくもない。

 欲しい結果に応じて、どうとでも根拠となる数字を作れてしまう、見つけられてしまうのだ。


 しかし本書は、統計学を用いたアミダくじの必勝法や、疫学といった様々な分野について解説し、ビッグデータを直接扱うために高価なクラウドシステムを本当に導入すべきかどうか疑問を投げかける。


 例は具体的かつ明快で面白く、なるほど、統計学を知っておき、できればそれを道具として活用できるようになっておかないと損をするかもしれない、と思わせるのに充分な内容だった。


 ちなみにまだ読んでないが実践編というのも出てる。

 

 こっちも楽しみだ。いずれ読もう