ケンブリッジ・アナリティカ事件は結局なんだったのか問題

事件の概要

2013年、ケンブリッジ大学の教員で、調査会社グローバル・サイエンス・リサーチを名乗るアレクサンダー・コーガン氏が、Facebookで利用できる性格診断アプリを開発した。当時のFacebook連携アプリは、本人の情報だけでなく、友人の情報まで簡単に取得することができた。

2014年、ケンブリッジ・アナリティカ社が、このアプリへの参加者をAmazonのクラウドソーシング(Mechanical Turk)で募集した。27万人が参加し、報酬は1人あたり1ドルから2ドルだった。これによってケンブリッジ・アナリティカは27万人のデータと、その友達も含めた5000万人に及ぶデータをぶっこ抜いた。ちなみにケンブリッジ・アナリティカとケンブリッジ大とは無関係である。

2015年、FacebookはAPIに手を加え、アプリ利用時に友人の情報まで取得する機能を制限した。同年、ガーディアンの報道で、グローバル・サイエンス・リサーチからケンブリッジ・アナリティカへのデータ共有がメディアで話題になったため、Facebookはこのポリシー違反に対して、法的措置をとった。ケンブリッジ・アナリティカはデータを削除したと、証明書を提出した。

2018年、ガーディアンやニューヨーク・タイムズが、問題のデータをケンブリッジ・アナリティカが未だ保持しており、2016年の大統領選でも利用された疑いを報じた。当時ケンブリッジ・アナリティカはトランプ陣営に雇われていた。

なぜこんなことが起きたのか

さて、本件は大規模なデータ流出事件、データ漏洩事件と言われているが、実際のところ明確な問題があったのは一点である。それはリサーチ会社(という建前の)グローバル・サイエンス・リサーチから、選挙コンサルティングを手がけるケンブリッジ・アナリティカにデータが渡ったことだ。繰り返すが、これはFacebookのポリシーに違反している。

Facebookが直接データを流出させたわけではない。性格診断アプリは利用者が同意の上で利用したものだ。クラウドソーシングを使って友人のデータまでぶっこ抜いたことも、当時のFacebookのポリシーでは問題のないことであった。もちろん今となっては、もっと明確で厳格なポリシーがあったほうが良かったと思うべきだし、実際にFacebookはその後でポリシーを改訂している。

そう考えると、本件に対する当たり前の教訓としては、データは取り戻せないということである。何が原因であったにせよ、名前や年齢が第三者の手に渡ったら、それを変えることはできない。住所や交友関係、政治的志向も簡単には変えられないだろう。また、Facebook自身が味わったように、ポリシーを改訂しても、外部に漏れたデータを削除させたつもりでも、一度漏れたデータを追うのは難しい。

個人データにどのような価値があるのか

それはそれとして、5000万人のデータを分析して大統領選に影響を与えた〜という話が、どこまで信憑性があるのかは疑問である。はっきり言ってケンブリッジ・アナリティカの営業トークだったのではないかと思うし、実際のところデータは利用されていなかったという報道もある。

自分のデータが流出していたら気味が悪い。変な話だが、もし自分のデータが流出していたら、それには価値があると思いたくなるだろう。しかし本当にそうだろうか。

大統領選挙に利用されたという話を考えてみる。もしあなたの手元に、有権者の詳細な情報があって、一人一人の名前や年齢、住所、交友関係や政治的志向が分かったとしたら、何に使うだろうか。投票の行方を左右する、浮動層が見つけられるかもしれない。影響力の大きいインフルエンサーも見つけられるかもしれない。そういった層がどういうメディアを信じて、どういうセレブを好むか分かるかもしれない。

でもそれって個々人の詳細なデータが必要なのだろうか。大統領選なんて、どの地域で、どのタイミングで、どの層を狙う必要があるのか、ほとんど解明されている。だから、そこに大量のテレビCMが投下される。真偽不明の醜聞も次々に流れる。その上で、前回の選挙ではさらに、フェイクニュースが大きな役割を果たしたのではないか、と言われている。

そしてフェイクニュースの拡散に細かな個人データは必要ない。Facebookに(あるいはTwitterに、YouTubeに)投稿すれば、いまはアルゴリズムがそれを好みそうな人に自動的に届けてくれる。多く読まれたものは、アルゴリズムによってさらに多くの読者へと拡散されていく。これは誰でも出来ることで、個人の詳細なデータなんて必要ない。

本当の課題はどこにあるか

もちろん流出したデータに価値がない、というわけではない。個人の詳細なデータが手元にあるならば、それはマスを操作することよりも、個人を操るほうに向いているだろう(標的型攻撃、振り込み詐欺とか)。また大統領選のような、誰もが注目して明確な結果が出るものについて世論を誘導するよりは、長期的なトピックについて潜在的に誘導するほうが使いやすいだろう(移民の是非とか)。

ただ、Facebookから抜かれたデータでトランプが大統領に就任した〜というのは、あまりに安直なストーリーである。

EUのデータ保護規制(GDPR)はすでに話題であり、今回の騒動で他国でも強固なデータ規制が必要だと言われている。Facebookはすでに、APIによるデータ共有をますます制限しはじめている。また今回の件に対応したものか分からないが、パートナーカテゴリーという第三者データでFacebook広告を利用する機能も廃止する。

データの移動や共有を規制すると、有利になるのはデータをすでに大量に保有しているプラットフォームで、もちろんFacebookはその一つである。すこし前までは、巨大すぎるプラットフォームが保持するデータのポータビリティを高めようという話だったはずなのに、いつのまにか状況が逆になってる。

そう考えると、今回の事件そのものよりも、なぜこれほどの大騒動になったのほうが興味深い。データ規制にしろ、データポータビリティにしろ、それを求める声があるのは「Facebookはたくさんのデータを持っている」ということに対する漠然とした不安感の裏返しではあにか。その大半はユーザー自身がアップロードしたデータなのだが、その対価がターゲティングされた広告というところが、納得を得られていないのかもしれない。

理想的には、データを渡したおかげで自分に関係のある広告が見られて良かったね、ということのはずだ。そもそもFacebookのような多機能プラットフォームを、広告のおかげで無料で使えて良かったね、ということのはずである。しかし、そこが納得されていない。

そしてこうした、データに対する対価はなんなのかという不安こそが、Facebookに限らず、成長を続けるデジタル広告業界がずっと解決できずにいる本当の課題ではないか……という話を書くとさらに長くなるので、元気があったらまた書きます。

1 リアクション

  1. youkosekiの投稿です