楽天の商品検索時のアルゴリズムの考察
2009年07月18日
最近、楽天の分析に凝ってまして。
商品検索結果のアルゴリズムも、何となく分かってきたので備忘です。
ただ、変わるかもしれないのと、間違ってる可能性も大です。
また、携帯に関しては、まったく調べてないので、アルゴリズムが違うかもしれません。
楽天の商品検索時の検索対象
- 検索対象は、商品番号・PC用キャッチコピー・モバイル用キャッチコピー・商品名・PC用商品説明文・モバイル用商品説明文・PC用販売説明文。
- もちろん検索キーワードが、完全一致で検索対象に含まれてないと駄目。
- 検索対象内での重み付けは、商品名>PC用商品説明文>PC用販売説明文のような気がします。
その他の項目は、まともに利用してないので、いまいち分かりません。 - マニュアルに表記されてませんが、検索対象として、ショップ内のカテゴリ名も見ているような気がします。
- 商品画像名(ALT)も見てるかも。
楽天の商品検索時の検索キーワード
- Googleのように、検索キーワードの揺らぎまでは見ていない。
- ディレクトリ名(全商品ディレクトリID)を単語辞書として、ディレクトリ名に完全一致した検索キーワードの場合。
そのディレクトリ(全商品ディレクトリID)の商品を上位表示 or そのディレクトリ(全商品ディレクトリID)の商品のみを表示のような気が。
なので、突然のディレクトリの変更などもありますが、マメにチェックして、ちゃんとしたディレクトリに所属させるのが吉。
楽天の商品検索時の並び順
- 検索時の並び順のキーは、ディレクトリ(全商品ディレクトリID)・検索キーワードの適合具合・レビュー数かと。
- 検索キーワードの適合具合は、検索対象と一緒で、商品名>PC用商品説明文>PC用販売説明文のような気が。
- レビュー数は、その検索結果の商品のレビュー数をすべて見て、それを100〜200・200〜300など大まかな数量で区切って、その中でランダムのような気がします。
なので、ずば抜けたレビュー数だと1位に張り付き。 - 並び順の重み付けは、難しいところですが、ディレクトリ(全商品ディレクトリID)>キーワードの適合具合>レビュー数のような気がします。
ただ、この通りではなく、ポイント制のようになっていて、各ポイントの総合計しつつ、検索結果の全商品をある程度のポイント数で区切ってランダム表示かと。
楽天の商品検索時のDBの更新頻度
- 検索時の商品の並び順は、毎日夕方に更新されているかと。
ただ、並び順は毎日更新ですが、そのバックグラウンドの各ポイントの要素(ディレクトリ(全商品ディレクトリID)・検索キーワードの適合具合・レビュー数)は、毎日だったり、毎週だったりのような。
検索キーワードの適合具合は、確実に毎日更新されています。