Hatena::ブログ(Diary)

糞ネット弁慶

日本声優統計学会/声優統計についてはこちら

2016-02-12

[] 「David Blei x Owen Zhang来日記念カンファレンス『データサイエンス最先端活用』」を (半分だけ) 聞いた 21:01  「David Blei x Owen Zhang来日記念カンファレンス『データサイエンス最先端活用』」を (半分だけ) 聞いたを含むブックマーク

David Blei x Owen Zhang来日記念カンファレンス「データサイエンス最先端活用」

David M. BleiOwen Zhang の話が聞けるということで行ってきた.

朝起きた瞬間から嫌な予感はしていたけれど、会場に着いたあたりで頭痛吐き気悪寒脂汗が止まらなくなってしまったため、午前中だけ聞いて帰って寝た.

メモが後半になるにつれ適当になっているのもそのため.

[基調講演1] "Probabilistic Topic Models and User Behavior" : Columbia大学 David Blei教授

資料 : Probabilistic Topic Models and User Behavior(pdf)

資料を読めば大体わかるので、いくつか載っていない点や気になった点をメモ.

[招待講演1] "鋼鉄の錬金術師を目指すNS Solutionsの取組紹介" : 株式会社新日鉄住金ソリューションズ 本橋智光様

  • 発表者について
    • データ分析にまつわる研究開発の部署ができたのはここ数年?
  • NSSOL がデータ分析を?
    • 親会社は新日鉄
      • 鉄の温度は直接測ることができない
      • 鉄の製造とデータ分析は深い関係がある
  • KDD Cup 2015 の話
    • タスク : 中国MOOC における離脱予測
    • 2位
      • 最終日までは祝賀ムードだったのに最後で抜かれた
    • アプローチ : 各自が大量の特徴量を作る
  • データ分析にまつわる業務
    • 案件のうち、70% はテーマを考えるところから
  • 各事例の紹介
  • その他
    • 自社サービス : Data Veraci
    • Data Robot ともやっている.作ってくるモデルがすごい.
  • 質疑
    • Q. モデルの解釈性とブラックボックス化について
      • A. 現場が強いところは解釈性を求める
    • Q. (自分) 実案件において精度をどこまで追求するのか、やり始めるとキリがないタスクであるのでどのあたりで見切りをつけるのか
      • A. 現状の予測を置き換えるのならばそれと同等まで、モデルが存在しないタスクであれば現場の肌感と合う程度まで
    • Q. 分析と事業への反映のスピード感はどうか

[招待講演2] 事業成長とデータとの付き合い方 : 株式会社エウレカ 中村裕一

  • pairs(ペアーズ) - Facebookを利用した恋愛・婚活マッチングサービス の話
  • 様々なデータがある
    • デモグラ、位置、チャネル、時系列、行動、購買
  • 豊富なデータを事業開始当時から活用できたか?
    • No
    • 様々な課題があった
      • 量不足、質不足、基準が不明確、最終的な利用方法が不明
    • やりたいことは色々あったが最初からは無理
  • まずは分析するためのデータを追う
    • 「現状のデータが高度な分析を行うに値するデータであるのか」をチェックするところから始めた
    • 管理画面を作って基礎集計を表示する
      • 例 : ユニークユーザ、アクティブユーザなど
      • 「今何を見るべきか」に集中した
    • ある程度規模が大きくなってきたらようやく分析が可能になる
  • 規模拡大に伴うシステムの変化
    • 当初の SQL + PHP から Redshift へ
    • Go によるフルスクラッチにともない、 BigQuery で一元管理
      • 共通化によって各種 KPI の定義がバラバラだったものを統一
  • 結論 : データは武器にも弱点にもなる
  • 質疑
    • Q. (自分) 施策の精度が上がることによりマッチングが効率化されてしまったらサイトでお金を落とさなくなるのではないか
      • その場での思いつきだったけど、例えば人材紹介サービスであればマッチングによる成功報酬があるが、出合い系だとそういうわけでもないので難しいのでは、というのは真面目に考えた
      • A. 究極的にはそうだが、現状はそこまでなるとは考えていない.マッチングの精度が上がることを目指している.
トラックバック - http://d.hatena.ne.jp/repose/20160212/1455278469