ブログトップ 記事一覧 ログイン 無料ブログ開設

hamadakoichi blog このページをアンテナに追加 RSSフィード Twitter

2014-05-24

[][] 第36回 データマイニング+WEB@東京( #TokyoWebmining 36th ) −確率モデリング・サービス活用 祭り− を開催しました  第36回 データマイニング+WEB@東京( #TokyoWebmining 36th )  −確率モデリング・サービス活用 祭り− を開催しましたを含むブックマーク  第36回 データマイニング+WEB@東京( #TokyoWebmining 36th )  −確率モデリング・サービス活用 祭り− を開催しましたのブックマークコメント

2014/5/24 "第36回 データマイニング+WEB@東京( #TokyoWebmining 36th ) −確率モデリング・サービス活用 祭り−"を開催しました。

会場提供し運営を手伝って下さったニフティのみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

f:id:hamadakoichi:20140524134749j:image

参加者Twitter List: Twitter List TokyoWebmining 36th

参加者セキココ:第36回 データマイニング+WEB @東京 セキココ

(作成してくれた @ さんに感謝)

以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk:

O1.「データマイニング+WEB@東京 について」(15分)

講師:@


O2.「参加者全員 自己紹介 (興味・活動)」(進行:@) (75分)

1. アンカンファレンス (司会進行: @

進行説明 (5分) ( 進行: @)


Topic LT(計20分)/チーム分散・チーム内議論 (45分) /各チーム発表(計20分)
Topic 1.「インターネット広告代理店の現場におけるデータ分析探訪」( 講師:@ )

スピーカーはインターネット広告代理店で約3年間データアナリストとして働いています。最近のデータ分析ブームの煽りを受けて、営業が主役のインターネット広告代理店の現場でも、統計学データマイニングを活用したデータ分析が注目され、活用されるようになっています。

ショートトークでは、スピーカーが約3年間で経験した中で、現場で活用されるデータ分析手法の一覧を紹介します。具体的には、回帰分析、時系列分析、因子分析、クラスター分析、実験計画法、数学的な予測モデルなどの、インターネット広告の現場への応用を紹介します。

※6月のトークでは、これらのデータ分析の中でもより数学的な色彩が強い方法を紹介します。具体的には、広告間の相関を考慮した複数広告への予算ポートフォリオのための「マルコフ連鎖によるアトリビューション分析」を紹介します。

議論ホワイトボード

f:id:hamadakoichi:20140524152930j:image


Topic 2.「確率過程と戯れる」( 講師:@ )

金融工学経済学マーケティングなど幅広い領域で確率現象が登場します。確率現象を理解し、最適化するために確率と仲良くするにはどうしたらよいでしょうか。ショートトークでは確率過程と"戯れる"方法の一つとして『経路積分』と呼ばれる手法を、ダイジェスト版&イメージ重視でやさしく紹介します。経路積分は確率過程を解析する便利なツールとして使え、金融工学の解析に応用されたりしています。様々な分野への応用可能性にも少し言及したいです。

※より詳しい紹介(金融工学やネット広告への応用の可能性)は6月のトークで行う予定です。

議論ホワイトボード

f:id:hamadakoichi:20140524151201j:image

Topic 3. 「データから導きだすABテストの手法」( 講師:@ )

ウェブサービス開発・マーケティングにおいて「イテレーション」や「カイゼン」のコンセプトが出てきて久しくなりました。リリースするのがゴールではなく、そこからどのようにしてパフォーマンス・KPIを高めていくかが重要視されています。そうした環境にいる方を集め、どのようなデータを集めるのか、そしてそのデータをどのように活用していくかを議論します。多くあるテストの中で最もポピュラーなABテストに照準をしぼり、実践されているテクニックについて共有出来る場を設けることが出来れば幸いです。

議論ホワイトボード

f:id:hamadakoichi:20140524150637j:image


2.「国立病院機構における診療情報分析について」(講師: @)(発表20分 + 議論25分)

国立病院機構本部診療情報分析部は2010年度、診療情報データバンクを整備し、機構144病院から診療データを集め分析を行っています。収集データの特性と問題点、分析のためのデータセット構築に至るまでの各種問題の解決、およびそれらを元に行っている分析をご紹介します。

参考文献:


3.「On Kaggle Re-ranking contest」 (講師: @ )(発表25分 + 議論30分)

f:id:hamadakoichi:20140524162141p:image:h360

資料リンク:http://fulmicoton.com/slides/tokyo_webmining

(フランスから Kaggle機械学習コンテスト1位の@ さんが来日し話してくれました)

End of 2013, Russian search engine "Yandex" organized a personalized re-ranking contest hosted on Kaggle. The goal of the competition was to re-rank top-10 URLs returned by the search engine using historical information about the user. Dataiku sponsored a team which eventually won first prize. This presentation will talk about the general problem of reranking, its pitfalls, and will go through a simple approach called point-wise. It will also be the tale of our journey through the contest.

参考文献:



各TRY 状況報告 (@)

※資料公開され次第、追記します。

附箋纏めと、次回以降講師立候補・タイトル決め (進行:@) (30分) 

D. 参加者の声・ディスカッション (進行:@ ) (40分)

■講師立候補・振返り:

「講師立候補」進行:@ (20分)

「振返り」進行:@(40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

風景:ホワイトボード

f:id:hamadakoichi:20140524194801j:image

※発表立候補、Keep・Try項目に関しては、下記ツイートまとめをご覧下さい。

推薦文献
言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)

関連ツイート(Togetter)

「第36回 データマイニング+WEB@東京( #TokyoWebmining 36th )−確率モデリング・サービス活用 祭り−」に関するツイートTogetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)


講師募集

データマイニング+WEB勉強会東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:


過去開催内容:

トラックバック - http://d.hatena.ne.jp/hamadakoichi/20140524/p1