- 2013-03-29 (金) 1:15
僕はネイト・シルバー。FiveThirtyEightの創設者だ。このブログはニューヨーク・タイムズの読者向けに、データで溢れかえり雑然としたこの世界を、わかりやすく解き明かしている。また、「シグナルとノイズ」という、”予測”の世界についての本を書いた。Amazonで購入できる。
なんでも聞いてくれ。特にお話したいのは、2012年の大統領選の予測、どのようにして投票の流れが変わったか、アメリカの財政やスポーツについてだ。
元スレ: IAmA blogger for FiveThirtyEight at The New York Times. Ask me anything.
(訳注: ネイト・シルバーはセイバーメトリクス(野球で、データの統計学的分析から選手を評価したり戦略を考える手法。日本では映画「マネー・ボール」で有名になった)を用いたシステムを開発したのち、選挙予測の世界へ進出すると、2012年のアメリカ大統領選挙では50州中50州の結果を的中させ、話題となった。ネイト・シルバーについての日本語記事。)
2012年の選挙は、かなりきわどい戦いだった。2000年の選挙ほどではないが、普通以上にはきわどかった。
よく混同されているのが、「きわどさ」と「不確かさ」だ。たとえば、ある野球の試合で、9回裏、3対2、マウンドにはパペルボン、とかそんな感じだとしよう。それが「きわどい」試合であるのは確かだが、「結果が全く予測できない」というわけではない。
もう少し具体的な話をすれば、(1) デンバーから始まったロムニーの「勢い」が衰え始めたこと、そして(2) 選挙戦の最後に起こった大きなニュース(ハリケーン・サンディ)がオバマに有利に働いたこと、が明らかになった時点で、一定の不確かさが取り除かれた。
集団思考と、ゆがんだインセンティブ(訳注: ロムニー有利、という予測を出すことで何らかの利益が得られた)が原因だ。彼らの調査や分析自体もまずかったが、それ以上に間違いが大きくなった。
マスコミは「物語を盛り上げ」たがる。たとえば、選挙戦の一部始終を報道した。総選挙の各ステージの報道もしたし、ロムニーが余裕綽々だった予備選挙終盤には、たぶんもっと報道があった。結果はもう明らかだったのにね。そのあたりに、彼らと文化の合わないところがある。
歴史的に言えば、二極化が進めば進むほど、第三極の候補者は健闘しやすくなる。したがって、独立勢力が成功する確率はたぶん通常よりも高まっている。
とはいえ、2016年の選挙で独立候補が勝利する確率は3-5%といったところだろう(1-2%ってことはないかな、という意味で)。何か完璧な偶然の嵐が必要だ。
- オバマへの世間の評価が著しく低くなる。
- 共和党がひどい候補を出す。
- 誰かとてつもなく優れた人が立候補し、選挙戦で大成功する。
- そして、選挙人制度の中で何度か幸運をつかむ。(訳注: 大統領選では勝者総取り方式を採用する州が多く、得票数が少なくとも勝利する可能性がある)
など。どのステップも不可能というわけではないが、それらすべてが成り立つ確率はものすごく低いね。
少しその心配はしている。候補者の支持者たちが「勝つに決まってるだろう」と思って投票に行かず、だが実は結構な接戦で、その結果負けてしまうという、「危険地帯」がおそらくある。
たとえば、2008年のニューハンプシャーにおける民主党予備選挙で、たぶんそれが起こった。あの時ヒラリーが勝った理由は色々あるが、たぶん、本来ならばオバマに入れていたであろう無党派層の投票者の多くが、「こっちの方が接戦になりそうだから」といって共和党予備選挙の方に行ってしまったのも要因の一つだろう。
ええと、それについてはこんな感じかな、と思っている。統計的な分析は、バスケットボールや、(特に)フットボールにおいては、野球の場合ほどには効果を発揮しない。だがそれでも、その効果は、他の業界における統計的分析の効果よりはずっと大きい。
多くのNBAチーム(特に勝ちを重ねているチーム)では、意思決定のプロセスが非常に洗練されている。たぶんバスケットボールは、フットボールよりは野球に近いんだろう。理論的にも、実践的にも。
サッカーのリーグでは伝統的に、ゴールとカードのことしか記録していない。だから、そのデータからマイニングできることには限りがある。
だが、EPL(イングランド・プレミアリーグ)やMLS(メジャーリーグサッカー)では他の種類の統計(タックル、パス、ボール支配率など)の記録も始めたそうだから、そのうち調査してみたいとは思っている。
思うに、比較的手の届きやすいところに成果が眠っているのではないだろうか。サッカーの文化では、データ主義はかなり嫌われる傾向にあったみたいだから(ほとんどのアメリカのスポーツと比べても)。
ハードコアな分析にはStataを使っている。あとはExcel。
先週メキシコに行ったんだけど、テオティワカンの太陽のピラミッドの頂上で気づかれた。これは間違いなくアポカリプスの予兆だと思った。
君のやっていること、そして君が出来ることに関して、一番の誤解は何?
君が有名になるにつれて、「シルバーはすべてを計算できる魔法使いだ」みたいなジョークがたくさん出てきたけど、統計学とは実際のところ何なのか、ということの理解はおざなりになっている。
人々はしばしば、複雑な系における予測の信頼性を過大に評価する。(訳注: 複雑な条件下では、一般に予測の信頼性は落ちる)
もちろん例外もある(高い信頼性で予測ができる事柄もある)。大統領選挙はほぼ間違いなく、「例外」の一つだ。
私がその「例外」で有名だというのは、少し奇妙というか、皮肉というか。
過学習だ。僕の本の中でも大きく取り上げているが、人々が思っている以上に致命的な間違いだ。
これはちょっと曖昧すぎるかもしれないけど、本での勉強を減らして、その代わりにデータセットをいじくり始めるのが一番大事なことだと思う。
政治だ。圧倒的に。評論家と狂信的な党員に挟まれながら、ひどく妄想癖のあるたくさんの人々と付き合わなければならない。
それにスポーツでは、現実を目の当たりにする機会が頻繁にある。たとえばもし君が「ノートルダム大は最高だ」(訳注: アメフトの名門)と触れ回っていたならば、きっと昨晩、手痛く現実に引き戻されたことだろう。
政治では、ひと度妄想にとりつかれると、何年もそのままだ。
- Older: 病院に盗みに入る仕事してるけど何か質問ある?
コメント:1
- 匿名 13-03-29 (金) 6:13
-
読売か朝日で見たなこの人。ビッグデータに注目が集まる中でイコン的扱いを受けてるんだろうね。
大統領戦の予測で何が面白いって、実は当のアメリカ人もオバマが勝つだろうって薄々分かってたってことだよね。まあオバマだろ、的な。この人はそういう漠然としま直感をデータから裏付けうると示したと言えるんだと思う。日本人は(自分を含めて)こういう「勘」を分析することが本当に苦手だよね。これはこれから誰もが慎重に取り組んでいかなきゃいけないことだと思う。
トラックバック:1
- このエントリーのトラックバックURL
- http://ama.an-pan-man.com/archives/1006/trackback
- Listed below are links to weblogs that reference
- アメリカ大統領選挙の結果を予言したデータサイエンティストだけど何か質問ある? from AMAの世界
- pingback from 【経済】 デフレは、賃金を下げ過ぎた経営者の責任だ:日経ビジネスオンライン 2013年03月29日 昼刊 | aquadrops * news 13-03-29 (金) 12:01
-
[...] アメリカ大統領選挙の結果を予言したデータサイエンティストだけど何か質問ある? | AMAの世界 僕はネイト・シルバー。FiveThirtyEightの創設者だ。このブログはニューヨーク・タイムズの [...]