最近、ネット上のreCAPTCHAで、Googleストリートビューの番地表示らしき数字を見かけたことがないだろうか。Googleは、同社の対スパムシステムであるreCAPTCHAの技術を使い、ユーザーに通りの名前や番地を識別してもらうことで、Googleマップのデータを改善する実験をしていることを認めた。
ご存じない方のために書いておくと、reCAPTCHAは、当初カーネギー・メロン大学でCAPTCHA(別名”Completely Automated Public Turing Test To Tell Computers and Humans Apart”)― 歪んだ文字でロボットによるユーザー登録を阻止するしくみ ― を改善するために開発された。reCAPTCHAの技術は2009年にGoogleに買収され、ウェブを使ったことのある人なら間違いなく使ったことがあるはずだ。文字や数字の画像を識別することで、あなたが人間であることを検証するセキュリティー質問として使われている。
このシステムはスパムやなりすましを阻止するために作られたものだが、本や新聞など印刷物のテキストをデジタル化するのにも役立つ。GoogleはこれまでもGoogleブックスやGoogleニュースアーカイブなどのデジタル化コンテンツにreCAPTCHAを利用してきた。
しかし過去数日間、何人かのユーザーが見たのは、新しいタイプのreCAPTCHA ― 写真 ― だった。新しいreCAPTCHAは片方には見慣れた歪んだ文字が、もう片方にはどこか不鮮明な(ズームアップしたような)数字の写真が表示されている。数字は明らかに番地で、Googleがストリートビューから取ってきたものと推察される。
この新reCAPTCHAが出てくることが知られている場所の一つは、GoogleのAdWordsウェブサイトで、その中のキーワード・ツールを操作するページだ。ただし、いつもこの新しいreCAPTCHAを見られるわけではない ― 私は今日の午前このページを何十回となく再読み込みしたが、一度も現れていない。人にもよるようだ。
上に貼った画像が新しいreCAPTCHAのサンプルだ。
さらに大きなコレクションが、Blackhatworldフォーラムで見られる(下の画像)。
Googleの広報担当者によると、このシステムは番地に限らず通りの名前や道路標識にも使われているそうだ。ただし、番地以外のものは実際にはまだ見つかっていない。
Googleはこう言っている。
現在行っている実験では、ストリートビューの画像をCAPTCHAに利用している。当社では会社の住所などの有用な情報によってGoogleマップを改善するために、通りの名前や道路標識のデータをストリートビュー画像から抽出することがよく行われている。これらのreCAPTCHAのテスト結果に基づき、画像を利用することでロボットによるネットの不正利用に対抗する当社のツールを、さらに洗練できるかどうかを判断するつもりだ。
多くのユーザーがごく最近気付いたようだが、Googleは実験が開始されたのは数週間前だと言っている。
Image credit: Ian for the top photo; Blackhatworld user “dirtbag” (heh.)
[原文へ]
(翻訳:Nob Takahashi)