管理人さんさんのページ

アクセス記録[アクセスアップ.orgの外部からのアクセス元URL (昨日 / 過去8日間) / ログイン状態の論客]
メニュー
プロフィール
私書箱
受/送/送済
評価履歴
共感[/]
ファン登録
推薦評価
書き物
リンク集
登録有

表示スタイル
ホームページ型
携帯版日記
画像集
動画リンク集
音声リンク集
リンク集
表示開始年月
分類
個人ページ内検索

反応日時来客名来客者の最近のメッセージ
12007/09/24清流滝哉こちらでははじめまして。管理人さん。清流滝哉です。こちらの携...
22007/09/23斐川 竜斗どうも、失礼します。丁寧に教えてくれて感謝ですね。あと、もう...
32007/09/22メテオこんばんわ。皆様すみませんでした。少し不具合がありましたが、...
42007/09/21メテオメテオです。ありがとうございます。手軽になり嬉しい限りです。...
52007/09/21エンシこんばんは、エンシです、お邪魔します。またも携帯のコンテンツ...
その他最近の感想 / 感想投稿回数ランキング

1. 2007/10/18 「検索比較: 画像検索における「初音ミク」問題の正解となる答え」 分類:検索エンジンレポート <=リンク先は同分類の記事リスト
[この書込みのみ表示(記事URL紹介用) / 書込変更/削除 / トラックバック送信 / 共有分類に追加(タグ付け)](この日の語りにコメント/感想つけてみる)

  1. 事件のあらまし
  2. でも答えは簡単
  3. 検索エンジンの仕組みのリマインド
  4. 小さいところにできて何故大手ができないのかの理由
  5. GoogleはGoogleでどちらにせよ質の問題がある
  6. 画像検索自体の順位付け
  7. accessup.orgへの上記評価の反映

1. 事件のあらまし

巷では初音ミクの画像が大手検索エンジンにて検索できないことが、   
陰謀説として盛り上がっています(TBS問題とかがあったから)。          
http://www.itmedia.co.jp/news/articles/0710/18/news040.html           
http://gigazine.net/index.php?/news/comments/20071018_vocaloid2_image/      
http://gigazine.net/index.php?/news/comments/20071018_vocaloid2_image_tel/


2. でも答えは簡単

画像検索は完全領域外なので(中の人になったことないので)、     
一般的に世に知られている事実からのみで答えを書いてしまうと、  
検索結果に出ない組の画像検索のインデックスは、           
2007年8月31日(=「初音ミク」の発売日)以前に収集した画像を検索対象にしているからでしょう(無いものは検索できない)。       
また、「初音ミク」という言葉自体、発売日前にガンガン書かれているようなものではなかったので           
(ブログ検索結果の期間をづらしてそう判断しました: http://ask.jp/blog.asp?o=0&qsrc=231&q=%e5%88%9d%e9%9f%b3%e3%83%9f%e3%82%af&qid=813F03CAF353437FA9723DC6B3635A82&bd=2007%2f07%2f19&md=2007%2f06%2f20&terms=2007%2f10%2f18%2c1%7c2007%2f09%2f17%2c1%7c2007%2f08%2f18%2c1%7c2007%2f07%2f19%2c1)  
ちなみに、↑の検索結果の一番初めのブログ記事を書いた人は、「初音ミク」の中の人の一人のようなので、そこからが理論的には「初音ミク」を検索対象にするチャンスが検索エンジンに与えられ始めた時期になるということですね。        
ただあくまで激烈にブレークしたのはリリース後のニコニコの展開があったからなので、少なくとも言えることが、一ヶ月以内のものは検索対象に出来ないということですね(もっと長い期間無理かもしれませんが)。


3. 検索エンジンの仕組みのリマインド

なお、ブログ検索など1分以内の記事も検索できるようなエンジンが出てきて皆忘れてしまったのかもしれませんが、
クロール→検索対象化→QA→リリース
のサイクルは数ヶ月以上かかるのは昔は常識でした。
ヤフーの画像検索のインデックスの更新は半年に一回とか言われていた位ですので、最近1・2ヶ月内に登場した画像?、そんな新しい画像は検索できないよー、というのは何ら不思議なことではありません。
ただ、問い合わせられても、他検索エンジンと比較されている以上、そこまでのことは外には言いたくないでしょうが。
結果を出せる検索エンジンと出せない検索エンジンの差は、規制・削除されたというわけではなく、画像検索結果のフレッシュさの差ということですね。
但し、今回の騒動はMSNの日本のウェブ検索の評価結果は
Yahoo > MSN > Google
という自己診断プレスリリース
http://headlines.yahoo.co.jp/hl?a=20071017-00000002-zdn_ait-sci
と重なったので(それが各検索エンジン結果の比較が始まるきっかけだったので/TBS問題もありますが)、結果的にMSNの新インデックスのリリースが近く、インデックスの内容が比較的新しい状態だった、というのもあるのかもしれません。


4. 小さいところにできて何故大手ができないのかの理由

ちなみに、ここで、何故大手ウェブ検索の方が、gooとかlivedoorのようなとこと異なり、それが出来ていないのかというと、
ウェブ検索用にクロール(世界中だから1サイクルに時間がかかる)

そこから画像検索用の文章を抽出
という、画像検索に集中していない集め方をしているからじゃないかな、と思います(画像検索は中の人じゃないから推測)。
ウェブサイトを集めてから、imgタグを分析して画像を引っこ抜きます。
ウェブ検索用文章収集ついで(派生して)に、画像検索用のインデックスを作らせてもらうというのは、大量のアクセスをウェブサイトにしかける検索エンジンとしては、合理的な選択だと思います。
なので、一般的に、ウェブ検索のインデックス更新サイクルよりも画像検索のインデックス更新サイクルの方が時間がかかるでしょう。
ただ、それに加えて、画像共有サイトも検索対象にして、そこは別サイクルで回して結果に混ぜて出せるようなパーティッションを作っていたりしたら、こんな問題は起きなかったのでしょうが。


5. GoogleはGoogleでどちらにせよ質の問題がある

なお、フレッシュネスというのは、検索結果の評価においては一部の要素でしかないので、それをもってどうこうということはないのですが、ただ、結果を出した上で、その結果が滅茶苦茶なものばかりのGoogleは、検索結果について根本的に改善しないといけないところがあるんでしょうね(画像をひっかける条件がゆる過ぎなのか、バグなのか)。


6. 画像検索自体の順位付け

ちなみに、初音ミクだけを見ると、
MSN > Goo > Yahoo or PicSearch(ask.jpが借りている) > Google
という結果になってしまいますが、ある程度時間が経てば(格納されれば)、
より大きい領域から集めているYahooやGoogleの検索可能件数がMSNやGooより多くなります。
なので、それだけの問題をもって、MSNはGoogleやYahooより優れている、と言えるわけではりません(ただフレッシュネスの面で強いのは分かりました)。
むしろ、画像検索はユーザーインターフェースが検索エンジン毎にかなり違うので、それの出来がどうなっているかが大きく利用経験を分けると個人的には思います。
で、私が画像検索について順位をつけるとしたら、
1位Yahoo画像をクリックしたら画像が表示される唯一つの「画像検索」エンジン。世界最大の画像共有サイトFlickrを傘下に持っているのが大きい
2位goo今回ので気づいたけれども件数はともかく収集したものの反映が速い組だから
3位Google現在の初音ミクについては最下位の結果と言っても良いですが(ノイズを表示しているだけなので)、普通に結果を出せるものでは妥当な結果だし、結果も大手らしいヒット数を出しているから
4位MSNフレッシュネスさなど内容が評価できるのに、ユーザーインターフェースが使いづらい。あと検索にひっかかる個数がYahoo, Google の1/5程度だったから(↓のらき☆すたで比較した時/新しいのでは勝つが古いのでは負ける)
5位PicSearch画像検索専用の会社だが規模が競合に比べて足りない(MSNやask.comから契約切られちゃったしこれ以上の投資は不可能か?)
というとこですね。


7. accessup.orgへの上記評価の反映

これに従って、画像一括検索と、画像集ページの順位と構成を変えてみました。
画像一括検索
http://find.accessup.org/find/ac.asp?S_iC=%95%B6%8E%9A&ocs=sjis&side=yes&q=%8F%89%89%B9%83%7E%83N&key=%8F%89%89%B9%83%7E%83N&defaults=G%2BY&engine=%89%E6%91%9C&blog_en=all_blog

画像集ページ
http://www.accessup.org/ani_imgj/7_Raki_20Suta.html


[この論客の他の日付の書込み含めて全て見る]
特定日付の書き物にコメント・感想を書いてみる
[日記・コメントの削除ルール]
一言で言えば: 喧嘩になること/場を荒らすことに繋がる内容は禁止 (必要なら私書で/但し私書にもルールがあります。別途参照)。
詳細はこちらの記事参照

コメントする日記の日付
ここは日記の「この書込みにコメント」をクリックすると自動的に入ります。手動入力不可)

注意
1. 書込みには階位が必要
2. 特殊機能使えます(高度な特殊機能(HPメニュー付与機能)は、コメントには使えません)。

お名前(階位必要)

パスワード


作品データベース目次 | 最速一括検索エンジン | サイトマップ | Copyright(c) 1999- 1st Class