それに、「データの量」がある程度の確保される場合でも、昨今の「バイラルメディア」的なものの流行で爆発的に増えた、ほぼコピペ・パクリで量だけはやたらと作られる「○○したいあなたが知っておくべき○つのポイント」(日本語圏ではそういうのより「マル秘芸能ニュース」みたいなブログ記事や、「2ちゃんのまとめ」が多いかも)みたいな、中身が薄くて内容の正確性も疑わしいような記事ばかりでは、「精度」という点での問題は残る。
ずーっと前、Googleの画像検索が一般に利用可能になったときに、「ジェリー・アダムズの写真を探すと、マーガレット・サッチャーの写真が出てくる」という現象が発生してみながお茶をふいた。問題のページは、見出しなど大きく評価される場所にはアダムズの名前があったが、使われている写真はサッチャーで、「アダムズと敵対関係にあるサッチャー」とキャプションがついていた。当時のGoogleさんは、これを「アダムズに関連した写真」として収集した。そして人間が「アダムズ」と入力したときに「お求めの写真はこちらです」とばかりに表示していたが、そこで決定的なズレが生じていたわけだ。だが、アダムズくらいにデータがたっぷりある人物なら、そういう「不具合」は徐々に修正されていくことが期待できる。
問題は、世界のあらゆる事象について、そのような期待ができるわけではないということだ。先ほど書いたGoogle Photosのタグ付けの「バグ」も、たぶん黒人の顔写真のデータが(あのような失礼な判定をしないようにするためには)足りていないというのが問題だったのだろう。
というわけで、話は変わるが、先ほどこのような写真をRTした。
この写真の出所について調べてみたら、「データが少ない」ことに起因する「精度の低さ」という問題に遭遇したので、メモをしておくことにする。
【続きを読む】
【i dont think im a pacifist/words at warの最新記事】