• Like
  • Save
協調フィルタリング
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

協調フィルタリング

  • 5,092 views
Uploaded on

ニコニコ動画で協調フィルタリング

ニコニコ動画で協調フィルタリング

More in: Technology , Business
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
5,092
On Slideshare
0
From Embeds
0
Number of Embeds
1

Actions

Shares
Downloads
0
Comments
0
Likes
9

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. ニコニコ動画で協調フィルタリング やってみた
  • 2. 発表の予定
    • ニコニコ動画
    • 協調フィルタリング
    • 仕組み
    • デモ
    • まとめ
  • 3. ニコニコ動画
    • 動画共有サイト
    • http:// www.nicovideo.jp
    • 会員数 : 約350万人
    • 動画数 : 約76万件
    • 一日の平均利用状況
    • PV 数 : 約 5500 万 PV
    • 訪問者数 : 120 万人(ユニーク)
    • 平均滞在時間 : 約 1 時間
  • 4. 協調フィルタリング
    • Collaborative Filtering
    • 多くのユーザーの嗜好情報を蓄積し、その情報をもとに任意のユーザーに対して、アルゴリズムに基づいてその人が好みそうな情報・選択肢を推測しそのユーザーを支援するシステム。
  • 5. 協調フィルタリング :: 例
    • Amazon
    • (買い物 )‏
    • Pandora,Last.fm
    • ( 音楽 )‏
    • Netflix
    • (映画)
    • eHarmony
    • (出会い)
  • 6. 今回の試み
    • 各ユーザーの好きな動画のリスト(マイリスト)の情報を収集しその情報から、ユーザーの嗜好を推測して、好きだろうと思われる動画を勧める。
  • 7. マイリスト
    • 注意 : これはイメージです。
  • 8. マイリスト :: テーブル表現 1 or 0 : マイリストに登録されているか否か 1 1 1 1 mylist   E 0 0 0 0 mylist   D 1 1 0 0 mylist   C 0 0 1 1 mylist   B 0 0 0 1 mylist   A video   4 video   3 video   2 video   1
  • 9. ピアソン相関係数 係数が1に近いほど X と Y が似ており -1に近いほど X と Y は正反対である。 係数が0のとき X と Y に相関はない。
  • 10. ピアソン相関係数 :: 例 初音ミクにオリジナル曲を歌ってもらいました「 for my dear 」 初音ミクによるオリジナル曲「初音の世界」  ver2.0 0.9
  • 11. ピアソン相関係数 :: 例 0.3 改造コードでコント  SFC マリオカート「がんばれルイージ」 「嫁のメシがまずい」 ACE COMBAT ZERO OP
  • 12. 類似度 :: テーブル表現 1.0 0.0 0.3 video 4 0.0 1.0 0.7 0.0 video 3 0.7 1.0 0.2 video 2 0.3 0.0 0.2 1.0 video 1 video   4 video   3 video   2 video   1
  • 13. 推薦度の計算
  • 14. 動画の推薦
    • 推薦度の計算結果に基づきおすすめ動画を決定する。
    • その際、当該ユーザーのマイリストにすでに入っている動画は除外する。
  • 15. Demo
  • 16. Demo http://miyaga50.homelinux.org/lab/nicovideo/
  • 17. 実装する際の問題
    • 今回はおよそ3万 × 3万の行列の行列なので 1件あたり0.01秒とすると100日以上かかる
    • 行列を計算するうえでの工夫が必要!
  • 18. 類似度行列の計算 この動画に対しては詳細なおすすめ動画を計算できる だけど、この動画に対しては おすすめ動画の計算が 全くできない\ (^o^) / video 4 0.7 0.0 video 3 0.3 0.7 1.0 0.2 video 2 0.3 0.0 0.2 1.0 video 1 video   4 video   3 video   2 video   1
  • 19. 類似度行列の計算
    • そのような理由によって今回は計算する箇所を
    • ある程度ランダムに選んで、手抜きしています。
  • 20. おすすめ動画の感想
    • 個人的な感想としては
    • 「それなりに自分の好きそうな動画がでてくるので
    • 及第点をあげてもいいかなあという感じ」
    • 某友人によると
    • 「確かにそれっぽい動画はでてくるんだけど、
    • いいとか悪いとか評価するのが難しいよね」
    • とのこと
  • 21. 改善するところ
    • 類似度行列の計算法の改良
    • 類似度行列に基づく推薦度の計算の計算法の改善
    • ウェブサイトのレスポンスの向上
  • 22. 参考文献
    • Toby Segaran
    • 『 Programming Collective Intelligence 』 O’Reilly