2014-05-24
■[Webmining][勉強会] 第36回 データマイニング+WEB@東京( #TokyoWebmining 36th ) −確率モデリング・サービス活用 祭り− を開催しました

2014/5/24 "第36回 データマイニング+WEB@東京( #TokyoWebmining 36th ) −確率モデリング・サービス活用 祭り−"を開催しました。
会場提供し運営を手伝って下さったニフティのみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。
参加者ID・バックグラウンド一覧
参加者Twitter List: Twitter List TokyoWebmining 36th
参加者セキココ:第36回 データマイニング+WEB @東京 セキココ
(作成してくれた @komiya_atsushi さんに感謝)
以下、全講師資料、関連資料、ツイートまとめです。
AGENDA:
■Opening Talk:
O1.「データマイニング+WEB@東京 について」(15分)
講師:@hamadakoichi
O2.「参加者全員 自己紹介 (興味・活動)」(進行:@hamadakoichi) (75分)
1. アンカンファレンス (司会進行: @haegwankim)
進行説明 (5分) ( 進行: @haegwankim)
Topic LT(計20分)/チーム分散・チーム内議論 (45分) /各チーム発表(計20分)
Topic 1.「インターネット広告代理店の現場におけるデータ分析探訪」( 講師:@hokagawa )
スピーカーはインターネット広告代理店で約3年間データアナリストとして働いています。最近のデータ分析ブームの煽りを受けて、営業が主役のインターネット広告代理店の現場でも、統計学やデータマイニングを活用したデータ分析が注目され、活用されるようになっています。
ショートトークでは、スピーカーが約3年間で経験した中で、現場で活用されるデータ分析手法の一覧を紹介します。具体的には、回帰分析、時系列分析、因子分析、クラスター分析、実験計画法、数学的な予測モデルなどの、インターネット広告の現場への応用を紹介します。
※6月のトークでは、これらのデータ分析の中でもより数学的な色彩が強い方法を紹介します。具体的には、広告間の相関を考慮した複数広告への予算ポートフォリオのための「マルコフ連鎖によるアトリビューション分析」を紹介します。
議論ホワイトボード:
Topic 2.「確率過程と戯れる」( 講師:@Masa_S3 )
金融工学、経済学、マーケティングなど幅広い領域で確率現象が登場します。確率現象を理解し、最適化するために確率と仲良くするにはどうしたらよいでしょうか。ショートトークでは確率過程と"戯れる"方法の一つとして『経路積分』と呼ばれる手法を、ダイジェスト版&イメージ重視でやさしく紹介します。経路積分は確率過程を解析する便利なツールとして使え、金融工学の解析に応用されたりしています。様々な分野への応用可能性にも少し言及したいです。
※より詳しい紹介(金融工学やネット広告への応用の可能性)は6月のトークで行う予定です。
議論ホワイトボード:
Topic 3. 「データから導きだすABテストの手法」( 講師:@haegwankim )
ウェブサービス開発・マーケティングにおいて「イテレーション」や「カイゼン」のコンセプトが出てきて久しくなりました。リリースするのがゴールではなく、そこからどのようにしてパフォーマンス・KPIを高めていくかが重要視されています。そうした環境にいる方を集め、どのようなデータを集めるのか、そしてそのデータをどのように活用していくかを議論します。多くあるテストの中で最もポピュラーなABテストに照準をしぼり、実践されているテクニックについて共有出来る場を設けることが出来れば幸いです。
議論ホワイトボード:
2.「国立病院機構における診療情報分析について」(講師: @imoan1983)(発表20分 + 議論25分)
国立病院機構本部診療情報分析部は2010年度、診療情報データバンクを整備し、機構144病院から診療データを集め分析を行っています。収集データの特性と問題点、分析のためのデータセット構築に至るまでの各種問題の解決、およびそれらを元に行っている分析をご紹介します。
参考文献:
3.「On Kaggle Re-ranking contest」 (講師: @fulmicoton )(発表25分 + 議論30分)
資料リンク:http://fulmicoton.com/slides/tokyo_webmining
(フランスから Kaggle機械学習コンテスト1位の@fulmicoton さんが来日し話してくれました)
End of 2013, Russian search engine "Yandex" organized a personalized re-ranking contest hosted on Kaggle. The goal of the competition was to re-rank top-10 URLs returned by the search engine using historical information about the user. Dataiku sponsored a team which eventually won first prize. This presentation will talk about the general problem of reranking, its pitfalls, and will go through a simple approach called point-wise. It will also be the tale of our journey through the contest.
参考文献:
- The challenge description and data
- To personalize or not to personalize: Modeling queries with variation in user intent.J.Teevan, S.T. Dumais, and D.J. Liebling. 2008
- From RankNet to LambdaRank to LambdaMART: An overview.C.J.C. Burges.
- Learning to rank using multiple classification and gradient boosting.P.Li, C.J.C. Burges, and Q.Wu.
- Fighting search engine amnesia: Reranking repeated results. M. Shokouhi, R. W. White, P. Bennett, and F. Radlinski.
- Dataiku’s Solution to Yandex’s Personalized Web Search Challenge
各TRY 状況報告 (@komiya_atsushi)
- ハッカソン提案(@haegwankim ): 10分
※資料公開され次第、追記します。
附箋纏めと、次回以降講師立候補・タイトル決め (進行:@hamadakoichi) (30分)
D. 参加者の声・ディスカッション (進行:@hamadakoichi ) (40分)
■講師立候補・振返り:
「講師立候補」進行:@hamadakoichi (20分)
「振返り」進行:@hamadakoichi(40分)
- KEEP/TRY 内容確認
- Keep/Try投票
- 各位所感
風景:ホワイトボード
※発表立候補、Keep・Try項目に関しては、下記ツイートまとめをご覧下さい。
推薦文献
入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック
- 作者: Matthew A. Russell,奥野陽(監訳),佐藤敏紀(監訳),瀬戸口光宏(監訳),原川浩一(監訳),水野貴明(監訳),長尾高弘
- 出版社/メーカー: オライリージャパン
- 発売日: 2011/11/26
- メディア: 大型本
- 購入: 18人 クリック: 779回
- この商品を含むブログ (42件) を見る
- 作者: 高村大也,奥村学
- 出版社/メーカー: コロナ社
- 発売日: 2010/07
- メディア: 単行本
- 購入: 13人 クリック: 235回
- この商品を含むブログ (38件) を見る
関連ツイート(Togetter)
「第36回 データマイニング+WEB@東京( #TokyoWebmining 36th )−確率モデリング・サービス活用 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)
講師募集
データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の Twitter か Google Group へのメールへぜひご連絡下さい。
連絡先:
過去開催内容:
- 第35回 データマイニング+WEB@東京( #TokyoWebmining 35th ) −サーベイ・オープンデータ活用祭り−を開催しました - hamadakoichi blog
- 第34回 データマイニング+WEB@東京( #TokyoWebmining 34th ) −パーソナライズ・マーケティング 祭り−を開催しました - hamadakoichi blog
- 第33回 データマイニング+WEB@東京( #TokyoWebmining 33rd ) − 大規模データ活用・サービス開発 祭り−を開催しました - hamadakoichi blog
- 第32回 データマイニング+WEB@東京( #TokyoWebmining 32nd ) −マーケティング最適化・最前線 祭り−を開催しました - hamadakoichi blog
- 第31回 データマイニング+WEB@東京( #TokyoWebmining 31st ) −大規模データ 活用・基盤・育成 祭り−を開催しました - hamadakoichi blog
- 第30回 データマイニング+WEB@東京( #TokyoWebmining 30th)−機械学習活用・マーケティング 祭り− を開催しました - hamadakoichi blog
- 第29回 データマイニング+WEB@東京( #TokyoWebmining 29th)−大規模解析・サービス活用 祭り− を開催しました - hamadakoichi blog
- 第28回 データマイニング+WEB@東京( #TokyoWebmining 28th) −データマイニング・機械学習とビジネス展開 祭り− を開催しました - hamadakoichi blog
- 第27回 データマイニング+WEB@東京( #TokyoWebmining 27th) −WEB解析・オープンデータ・クラウド 祭り− を開催しました - hamadakoichi blog
- 第26回 データマイニング+WEB@東京( #TokyoWebmining 26th) −オープンデータ活用・ソーシャ ル・アドテクノロジー 祭り− を開催しました - hamadakoichi blog
- 第25回 データマイニング+WEB@東京( #TokyoWebmining 25th) −大規模分散 高速解析・ユーザ徹底理解 祭り− を開催しました - hamadakoichi blog
- 第24回 データマイニング+WEB@東京( #TokyoWebmining 24th) −大規模データ・ソーシャル解析 祭り− を開催しました - hamadakoichi blog
- 第23回 データマイニング+WEB@東京( #TokyoWebmining 23rd)−大規模ソーシャルデータ・アクセス解析 祭り− を開催しました - hamadakoichi blog
- 第22回 データマイニング+WEB@東京( #TokyoWebmining 22nd)−広告最適化・アクセス解析・可視化 祭り− を開催しました - hamadakoichi blog
- 第21回 データマイニング+WEB@東京( #TokyoWebmining 21th)−ソーシャルグラフ解析・ビジネス展開 祭り− を開催しました - hamadakoichi blog
- 第20回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 20th)−ソーシャル・大規模解析 祭り− を開催しました - hamadakoichi blog
- 第19回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 19th)−データ徹底活用・機械学習 祭り− を開催しました - hamadakoichi blog
- 第18回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 18th)−大規模分散処理 最前線 祭り− を開催しました - hamadakoichi blog
- 第17回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 17th)−分散機械学習・ビジネス展開 祭り− を開催しました - hamadakoichi blog
- 第16回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 16th)−リアルタイム分散 Web解析・自然言語処理 祭り− を開催しました - hamadakoichi blog
- 第15回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 15th)−統計・ビジネス活用 祭り− を開催しました - hamadakoichi blog
- 第14回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 14th)−大規模分散データマイニング 祭り− を開催しました - hamadakoichi blog
- 第13回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 13th)−Mahout・大規模解析・ビジネス展開 祭り− を開催しました - hamadakoichi blog
- 第12回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 12th)−機械学習MapReduce・大規模R解析 祭り− を開催しました - hamadakoichi blog
- 第11回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 11th) −Mahout・Graphical Model・学術 祭り−を開催しました - hamadakoichi blog
- 第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)を開催しました −2nd Week−大規模分散 機械学習 祭り− - hamadakoichi blog
- 第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)を開催しました −1st Week−広告ネットワーク・グラフ解析・並列機械学習 祭り− - hamadakoichi blog
- 第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −2nd Week−方法論・ソーシャル祭り− を開催しました - hamadakoichi blog
- 第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −1st Week− 大規模解析・機械学習・クオンツ 祭り− を開催しました - hamadakoichi blog
- 第8回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #8) −大規模解析・ウェブ・クオンツ 祭り−を開催しました - hamadakoichi blog
- 第7回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #7) −機械学習・解析・セマンティックウェブ祭り−を開催しました - hamadakoichi blog
- 第6回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#6) −ソーシャル・広告・最適化祭り−を開催しました - hamadakoichi blog
- 第5回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#5) −WEB解析・最適化祭り−を開催しました - hamadakoichi blog
- 第4回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#4) −WEB祭り−を開催しました−「ソーシャルウェブ と レコメンデーション」 - hamadakoichi blog
- 第3回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#3) を開催しました−「R言語による クラスター分析 -活用編-」 - hamadakoichi blog
- 第2回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#2) を開催しました - 「はじめてでもわかる R言語によるクラスター分析」- - hamadakoichi blog
- 第1回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#1) を開催しました - 「はじめてでもわかる 統計解析・データマイニング R言語入門」 - hamadakoichi blog
- 13 http://t.co/M3EWK24ugS
- 4 http://t.co/NWQOR1q6OJ
- 4 http://t.co/R5BWRdu7iI
- 4 https://www.google.co.jp/
- 3 http://htn.to/fp6PtM
- 3 http://t.co/0jZuJtvQmk
- 2 http://api.twitter.com/1/statuses/show/470221386242203648.json
- 2 http://b.hatena.ne.jp/
- 2 http://bit.ly/1jI1dXC
- 2 http://www.google.com/url?q=http://d.hatena.ne.jp/hamadakoichi/20140524/p1&sa=D&sntz=1&usg=AFQjCNGK4nwhQpeerTzzf7A5Lh3DdMEHHg