大げさな宣伝にのせられて、日常生活を単調かつ難しいものにしている制約や複雑さを、誰か、あるいは何かが超越してくれると信じることはたやすい。
ビッグデータは、良い結末を追求するあまりに過剰な期待をしてしまうという現象の最近の犠牲者である。ある報告書が、ビッグデータに関する好例の1つである「Google Flu Trends(インフルトレンド)」に暗い影を投じたことをきっかけにして、ビッグデータ人気の揺り戻しが始まっている。
Google Flu Trendsは、人々が使っている検索語に基づいてインフルエンザの感染率を世界規模で予測するサービスであり、29カ国で行われている大量の検索を解析している。
2009年にNatureで発表された論文では、このサービスがわずか1日の遅れで予測を生成できるとされている。米国疾病対策予防センター(CDC)の場合は、診察した医師からのフィードバックに基づいた予想に1週間程度かかっており、Google Flu Trendsの予測はこれよりも速いことになる。
Google Flu Trendsの初期の成功により、ビッグデータの勝利を祝い、大規模なデータセットの相関によってノイズから情報を引き出せることを称賛するいくつもの記事が執筆された。その後、Financial Timesが指摘したように、すべてのデータポイントをとらえられるのだから、昔ながらの統計的サンプリング手法は時代遅れであり、統計的相関によってあらゆる有益な情報が明らかになると主張する記事が発表された。
しかし2014年3月に、Google Flu Trendsがインフルエンザ様疾患の流行を2倍近く多く見積もっていたことを示す論文が発表されると、何にもましてビッグデータの相関パターンに頼ることの限界を指摘する記事が次々と発表された。
その後、ビッグデータアナリティクスの状況を検証する一連の記事が発表された。さらにFinancial Timesでは、ケンブリッジ大学のWinton Professor of the Public Understanding of Risk(一般市民のリスク理解のためのウィントン教授)であるDavid Spiegelhalter氏が、ビッグデータの「チアリーダー」と同氏が呼ぶ人々の主張を、「たわごと」であると形容した。
そうした記事でも強調されていたように、関連データを100%取得したという確信がない限り、そして100%取得できるような限られた状況でない限り、大規模なデータセットは、データ分析を何十年にもわたって悩ませてきた落とし穴に苦しめられるだろう。それはサンプルのエラーとサンプルの偏りの問題という落とし穴だ。
大規模なデータセットから分かることをそのまま予測に用いると、こうした問題に足元をすくわれがちだ。Twitterからすべてのツイートを集めれば、Twitterユーザーの間に広がるムードは分かるが、その国のムードが分かるわけではない。これと同じような制約の影響を受けたのが、スマートフォンアプリの「Boston Street Bump」だ。このアプリは、自動車がボストン市内の通りを走行する際の大きな振動を検出することによって、舗装面の穴の位置を記録するものだ。このアプリが生成するデータは、舗装面の穴を表示した地図の作成のために収集されてきたが、その地図では、スマートフォンを所有する裕福な人が走行することの多い地域が優先されることになる。
ZDNetJapanでは2014年5月26日まで春の新生活応援企画として読者キャンペーンを実施しております。応募はこちらから
「情報共有の効率化」をテーマに
セミナーを開催いたします。
是非お立ち寄りください。
持ち運べるセキュリティツールの力(後篇)
「集中管理モード」で脅威への対応を一元化
モバイルファースト時代に広がるニーズと
現実のギャップを埋めるための方法
製品無償提供から技術支援・市場展開まで、
あらゆる局面で起業家をサポートするIBM
持ち運べるセキュリティツールの力(前篇)
XPサポート終了後の環境に迫る脅威を防ぐ!
クラウド時代もOracle WebLogic Serverが
企業のアプリケーション資産を保護する
いきなりのムチャぶり、対応できますか?
突如担当になったヨシダ。さて、どうする?!
IoT、Cloud、Moble、ビジネスを支えるIT
スピードと柔軟性が企業の力に!
OracleDatabase12cで管理者を面倒から解放
クイズに答えるとオラクルグッズプレゼント
クローズド環境でのウイルス対策の決定版
新製品TMPS2の情報・活用事例が満載!
「自由」で「便利」な環境を作るための
「Officeソフト」クラウド化のススメ
ビジネスの新たな潮流を生み出すSMACS
IT活用の答えがここにある!
開発者注目の6つの新機能と必読ドキュメント
新版最大の目玉はラムダ式!
最新サンドボックス技術を実装したUTM製品
中堅・中小企業に万全のセキュリティ対策を
Google の社内ポータルで3万人が活用する
社内検索、その活用方法と事例を紹介
ビッグデータは限られた専門家だけでなく
ビジネスに関わる全社員が活用する時代へ!
CDIが業務システム開発にもたらすメリット
そして、EJBとの使い分けは?
アプリケーション開発から保守・管理・運用
モバイル端末の利点を最大化するためには
モバイル対応や社内SNSの連携も強化
適用分野を広げるDynamics CRM
マイクロソフト社のセキュリティ対策とは?
東京・大阪・名古屋で4社が講演!
なじみのあるC言語とVisual Studioの活用で
組込み開発やアプリ開発も効率よく!
スタンダードとなった「Hyper-V」
マイクロソフトが繰り出す次の一手は!?
いまでも単純な量単価で考えていませんか?
最先端ストレージが提供する真の経済性
情シス部門の担当者としても見逃せない
XPのセキュリティ確保に有効なツールとは
見えない「思い込みの壁」を打破する
グループウェアの教科書
活用事例も増え「旬」を迎えたタブレット
企業で導入するメリットと選び方を紹介
インフラの革新、最新PowerSystemsをはじめ
OpenStackなど最先端テクノロジを紹介
ZDセミナーでクオリティソフト山﨑氏が講演し、
BYODのルール策定の必要性と具体策を提示した。
日本ユニシスはZDセミナーで講演し、自社でBYOD
を実践し得られた利用動向やノウハウを披露した
ファイア・アイはZDNetセミナーで講演を行い、
最新のサイバー攻撃について解説した。
3ステップで作る企業のITインフラとは?
CTCテクノロジー株式会社(CTC教育サービス)
NECマネジメントパートナー テクノロジー研修事業部
ピーエムシー・シエラ・ジャパン株式会社
ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。