受/送/送済 | 共感[受/送] | 登録有 |
| ||||||||||||||||||||||||
|
巷では初音ミクの画像が大手検索エンジンにて検索できないことが、
陰謀説として盛り上がっています(TBS問題とかがあったから)。
http://www.itmedia.co.jp/news/articles/0710/18/news040.html
http://gigazine.net/index.php?/news/comments/20071018_vocaloid2_image/
http://gigazine.net/index.php?/news/comments/20071018_vocaloid2_image_tel/
画像検索は完全領域外なので(中の人になったことないので)、
一般的に世に知られている事実からのみで答えを書いてしまうと、
検索結果に出ない組の画像検索のインデックスは、
2007年8月31日(=「初音ミク」の発売日)以前に収集した画像を検索対象にしているからでしょう(無いものは検索できない)。
また、「初音ミク」という言葉自体、発売日前にガンガン書かれているようなものではなかったので
(ブログ検索結果の期間をづらしてそう判断しました: http://ask.jp/blog.asp?o=0&qsrc=231&q=%e5%88%9d%e9%9f%b3%e3%83%9f%e3%82%af&qid=813F03CAF353437FA9723DC6B3635A82&bd=2007%2f07%2f19&md=2007%2f06%2f20&terms=2007%2f10%2f18%2c1%7c2007%2f09%2f17%2c1%7c2007%2f08%2f18%2c1%7c2007%2f07%2f19%2c1)
ちなみに、↑の検索結果の一番初めのブログ記事を書いた人は、「初音ミク」の中の人の一人のようなので、そこからが理論的には「初音ミク」を検索対象にするチャンスが検索エンジンに与えられ始めた時期になるということですね。
ただあくまで激烈にブレークしたのはリリース後のニコニコの展開があったからなので、少なくとも言えることが、一ヶ月以内のものは検索対象に出来ないということですね(もっと長い期間無理かもしれませんが)。
なお、ブログ検索など1分以内の記事も検索できるようなエンジンが出てきて皆忘れてしまったのかもしれませんが、
クロール→検索対象化→QA→リリース
のサイクルは数ヶ月以上かかるのは昔は常識でした。
ヤフーの画像検索のインデックスの更新は半年に一回とか言われていた位ですので、最近1・2ヶ月内に登場した画像?、そんな新しい画像は検索できないよー、というのは何ら不思議なことではありません。
ただ、問い合わせられても、他検索エンジンと比較されている以上、そこまでのことは外には言いたくないでしょうが。
結果を出せる検索エンジンと出せない検索エンジンの差は、規制・削除されたというわけではなく、画像検索結果のフレッシュさの差ということですね。
但し、今回の騒動はMSNの日本のウェブ検索の評価結果は
Yahoo > MSN > Google
という自己診断プレスリリース
http://headlines.yahoo.co.jp/hl?a=20071017-00000002-zdn_ait-sci
と重なったので(それが各検索エンジン結果の比較が始まるきっかけだったので/TBS問題もありますが)、結果的にMSNの新インデックスのリリースが近く、インデックスの内容が比較的新しい状態だった、というのもあるのかもしれません。
ちなみに、ここで、何故大手ウェブ検索の方が、gooとかlivedoorのようなとこと異なり、それが出来ていないのかというと、
ウェブ検索用にクロール(世界中だから1サイクルに時間がかかる)
↓
そこから画像検索用の文章を抽出
という、画像検索に集中していない集め方をしているからじゃないかな、と思います(画像検索は中の人じゃないから推測)。
ウェブサイトを集めてから、imgタグを分析して画像を引っこ抜きます。
ウェブ検索用文章収集ついで(派生して)に、画像検索用のインデックスを作らせてもらうというのは、大量のアクセスをウェブサイトにしかける検索エンジンとしては、合理的な選択だと思います。
なので、一般的に、ウェブ検索のインデックス更新サイクルよりも画像検索のインデックス更新サイクルの方が時間がかかるでしょう。
ただ、それに加えて、画像共有サイトも検索対象にして、そこは別サイクルで回して結果に混ぜて出せるようなパーティッションを作っていたりしたら、こんな問題は起きなかったのでしょうが。
なお、フレッシュネスというのは、検索結果の評価においては一部の要素でしかないので、それをもってどうこうということはないのですが、ただ、結果を出した上で、その結果が滅茶苦茶なものばかりのGoogleは、検索結果について根本的に改善しないといけないところがあるんでしょうね(画像をひっかける条件がゆる過ぎなのか、バグなのか)。
ちなみに、初音ミクだけを見ると、
MSN > Goo > Yahoo or PicSearch(ask.jpが借りている) > Google
という結果になってしまいますが、ある程度時間が経てば(格納されれば)、
より大きい領域から集めているYahooやGoogleの検索可能件数がMSNやGooより多くなります。
なので、それだけの問題をもって、MSNはGoogleやYahooより優れている、と言えるわけではりません(ただフレッシュネスの面で強いのは分かりました)。
むしろ、画像検索はユーザーインターフェースが検索エンジン毎にかなり違うので、それの出来がどうなっているかが大きく利用経験を分けると個人的には思います。
で、私が画像検索について順位をつけるとしたら、
1位 | Yahoo | 画像をクリックしたら画像が表示される唯一つの「画像検索」エンジン。世界最大の画像共有サイトFlickrを傘下に持っているのが大きい |
2位 | goo | 今回ので気づいたけれども件数はともかく収集したものの反映が速い組だから |
3位 | 現在の初音ミクについては最下位の結果と言っても良いですが(ノイズを表示しているだけなので)、普通に結果を出せるものでは妥当な結果だし、結果も大手らしいヒット数を出しているから | |
4位 | MSN | フレッシュネスさなど内容が評価できるのに、ユーザーインターフェースが使いづらい。あと検索にひっかかる個数がYahoo, Google の1/5程度だったから(↓のらき☆すたで比較した時/新しいのでは勝つが古いのでは負ける) |
5位 | PicSearch | 画像検索専用の会社だが規模が競合に比べて足りない(MSNやask.comから契約切られちゃったしこれ以上の投資は不可能か?) |
これに従って、画像一括検索と、画像集ページの順位と構成を変えてみました。
画像一括検索
http://find.accessup.org/find/ac.asp?S_iC=%95%B6%8E%9A&ocs=sjis&side=yes&q=%8F%89%89%B9%83%7E%83N&key=%8F%89%89%B9%83%7E%83N&defaults=G%2BY&engine=%89%E6%91%9C&blog_en=all_blog
画像集ページ
http://www.accessup.org/ani_imgj/7_Raki_20Suta.html