最終更新時刻:2008年2月19日(火) 10時23分

77

検索結果の「鮮度」が変わる、Google "QDF"アルゴリズムの仕組み

公開日時:
2008/01/30 18:04
著者:
渡辺隆広

前々回の記事「百度、本気で日本の検索エンジン市場に参入する けど」の本文中で、Googleの検索結果が同じキーワードでも朝と夜で変化するという話を書きましたが、それについて説明している日本語の記事があまりないので、ここで解説をしておきます。この技術はもともと、米New York TimesのGoogleへのインタビューの中で紹介されたもので、QDF(query deserves freshness)と呼ばれるものです。日本国内では2007年4月以降、Googleウェブ検索によく「5分前」「1時間前」「4時間前」といったラベルつきのリンクが掲載されることがありますが、これはQDFアルゴリズムによるものです。

---------------

GoogleやYahoo!で検索した時に私たちが目にする検索結果の並び順というのは、ある時点におけるウェブページのランク付けの結果に基づいたものだ。ウェブページのキーワードとの適合性や、それに張られたリンクの数や質など多数の要因に基づいて算出されたスコアに応じてレレバンシー(関連性、適合性)が判定されている。さてこの検索結果、表示されるリンク(ページ)というのは最近作られた新しいページが多く含まれている方がいいのか、それとも昔から存在する古いページの方がいいのだろうか?

これはユーザーが何を探しているか、またそのキーワードに関連する世の中の出来事やユーザーの関心事に大きく依存する。つまり、検索結果の鮮度は新しければいいわけでもないし、古いほうがいいわけでもない、それはその時点でユーザーが持ち合わせているクエリインテント(検索意図)に依存する。

例えば、1月30日の夕方時点で、asahi.comなどに中国製の冷凍ギョーザを食べたことで腹痛や吐き気を訴えた人がいるというニュースが流れている(記事名:中国製冷凍ギョーザで腹痛・吐き気 農薬混入か 千葉)。例えばこのニュースが報道された時に冷凍ギョーザという検索数が増えた時、そのユーザーのインテントはおそらく冷凍ギョーザの作り方やおいしいお店を探しているのではなくて、そのニュースに関連する話題だろう。同じく、私が所属するアイレップという会社が世界的に注目を浴びる技術を発表したとして、その後に「アイレップ」という社名での検索数が伸びた時、このユーザーはきっとこの発表に関する話題に関心があって検索したのだろうし、発表前にアイレップと検索していたであろう、採用やIRなどに関心があって検索したユーザーとはインテントが異なるはずだ。

こうしたケースでは検索結果の鮮度は高いほうがいい、つまり今リアルタイムでおきている出来事について触れている最新のウェブページが多めに出たほうが、ユーザーの認識するレレバンシー評価は高いはずだ。

一方、いまこのタイミングで「足利尊氏」や「織田信長」などと検索した場合、検索結果の鮮度は重要だろうか?おそらく歴史的事象について調査したいことがあって検索していると推定されるのであって、ウェブページの鮮度は問題にならないはずだ。

このように、検索結果の鮮度はユーザーのインテントに左右されることになる。

この検索結果の鮮度に対して1つの解決策を提示し、実行しているのがGoogle。Googleは "QDF" (Query Deserves Freshness)というアルゴリズムを用いている。

仕組みは次の通りだ。ある一定の期間において、ブログ記事やニュース記事の中で特定のトピックの出現量が増加した時、Googleはそれを「話題性あり(hot)」と判断し、検索結果中に最新の情報を持つ(鮮度の高い)ページへのリンクの割合を増やす。これはGoogleが監視する検索クエリの増減量と照らし合わせて判定する。

例えば、「東京都」というキーワードが毎日平均1万前後の検索回数があるとしよう。ある日、このキーワードの検索回数が急に100万回に増えた時、何らかの出来事により世の中のユーザーが同キーワード(話題)に関心を持ったために検索数が急増したと推定できる。従って、Googleは「東京都」をホットなワードと認識し、検索結果1ページあたりの最新ページの割合を増やす。

ユーザーが使用した検索キーワードが「話題性がある」と判定されている間は、新規・更新されたページが検索結果に表示されやすくなるし、話題性がないと判断される検索キーワードで検索した時に新しいページばかりになってしまうことはない。ユーザーのインテントにあわせて検索結果の鮮度が決定できる。米Googleエンジニア・Amit Singhal氏はQDFによる成果として、ニューヨークで停電が起きた時、それを報じた記事が15分後には検索可能だった事例を挙げている。

このQDFの仕組みによって、次のように検索結果は変わる。先述した「冷凍ギョーザ」と検索した時(2008年1月30日17時時点)や、先日の虚偽の大量保有報告書が登録された「テラメント」と検索した時(同報道が流れた直後)にGoogleで検索すると検索結果1ページ目の大半は記事公開後8〜3時間未満のページのリンクが占めていた。

ちなみに、こうした仕組みを持たないYahoo!は冷凍ギョーザのショッピングサイトへのリンクが多数を占めていたり、テラメントと検索すると2件しか表示しなかった(当時)した。MSN / Live Searchに至っては当時"テラメント”という文字列が存在しなかったため、 テ ラ メ ン ト と言葉を分解した上で一致したページが検索結果に表示されていた。Yahoo!はYahoo!ニュースと連携して、一部のニュースの話題については自然検索の上部にニュース記事へのリンクボックスを表示するが、よほど話題性が高いニュースでないと表示されない模様だ(Yahoo!ニュースのトピックスに掲載されている記事のキーワードで検索しても、それほどボックスは表示されない)。

検索技術は精度が高ければグローバルに適用できるものではなく、その国の文化や習慣、言語の問題によって品質は左右されることはある。だから欧米ではGoogleが強くても韓国や中国、日本といったアジア圏ではトップシェアを持っていない。とはいえ、グローバルで展開している故に優位性を発揮できる点も数多く持ち合わせており(例えば自動翻訳技術(Google翻訳)などは面白い)、とりわけ日本では携帯分野でGoogleが単純な携帯利用者数シェアで8割にリーチできることで国内でのプレゼンスも高まるだろうし、今後どこまで国内でシェアを伸ばせるか楽しみなところでもある。
Googleで「冷凍ギョーザ」と検索した時。○分前のラベルがついたリンクが多数表示される
「冷凍ギョーザ」で検索した時の検索結果、2008年1月30日17時。

 

[追記] QDFの解説を修正・追加しました (2008/01/30 14:30)

※このエントリは CNET Japan ブロガーにより投稿されたものです。シーネットネットワークスジャパン および CNET Japan 編集部の見解・意向を示すものではありません。

このブログについて

ブロガープロフィール

最新のエントリー

アーカイブ

2008年2月
     12
3456789
10111213141516
17181920212223
242526272829 

カテゴリ

ブログネットワーク

アルファブロガー

村上敬亮 情報産業の未来図「雲を掴め」 
村上敬亮 情報産業の未来図
クロサカタツヤの情報通信インサイトわが心の情報流通(1)
クロサカタツヤの情報通信インサイト
末吉隆彦 ロケーションウェアの「空」と「実」はじめまして
末吉隆彦 ロケーションウェアの「空」と「実」
佐々木俊尚 ジャーナリストの視点ソーシャルメディアとしてのケータイ小説
佐々木俊尚 ジャーナリストの視点

読者ブロガー

SEO会社で働く社長のブログSEOの基礎 キーワードとLPの関係
SEO会社で働く社長のブログ

みんなのお題

新着コメント

日本の事はわからんけど、マーケットのでかさ+コンテンツホルーダー多数ってコトで、アメリカから一言。 ...
勝者はDVD? 
投稿者:est-ce
bentley_1919さん、コメントどうもありがとうございます。 以前から光ディスクもいつの間にか読めなくな...
ハイビジョンビデオカメラで撮影したデータを何で保管する? 
投稿者:hokky (cafe noir)
こんばんは。 >AVは展示販売があるので,HDとSDの画質の差がすぐわかりますが,純オーディオは聴く機会が?..
勝者はDVD? 
投稿者:Shin_s
返答はまとめさせて頂くのですが,コスト云々というのは,製造コストだけのことではありません. 次世代規...
勝者はDVD? 
投稿者:さぁや
もの凄く賛成です。レーザーディスクをDVDに買い換えるの結構大変ですよね。いまでも、まだ、すべてを買い?..
Blu-rayが勝ち残っても... 
投稿者:らるー。

ブログネットワークとは?

CNET Japan ブログネットワークは、元はCNET Japanの一読者であった読者ブロガーと、編集部の依頼により執筆されているアルファブロガーたちが、ブログを通じてオンタイムに批評や意見を発信する場である「オピニオンプレイス」、また、オピニオンを交換するブロガーたちが集うソサエティです。

広い視野と鋭い目を持ったブロガーたちが、今日のIT業界や製品に対するビジョンや見解について日々熱く語っています。

あなたもブログを書いてみませんか?

CNET Japanやその他サイトが提供するITニュースやコンテンツへの意見や分析、 ビジネスやテクノロジーに対するビジョンや見解について語っていただける方を 募集しています。ご応募はこちらから

ブログの投稿・管理

ブログの投稿はこちらから(※ブロガー専用)

ブログアワード2007開催決定!

今年最も活躍したブロガーを表彰します。詳細はこちらから

αマークって?

これは、CNET Japan 編集部の依頼に基づいて執筆されているCNET Japan アルファブロガーによるブログの印です。

Good!って?

CNET Japan ブログネットワーク内で拍手の代わりに使用する機能です。ブログを読んで、感激した・役に立ったなど、うれしいと思ったときにクリックしてください。多くGood!を獲得した記事は、より多くの人に読まれるように表示されます。

CNET Japan Special