戦略的データサイエンス入門を読んだ
戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック
- 作者: Foster Provost,Tom Fawcett,竹田正和(監訳),古畠敦,瀬戸山雅人,大木嘉人,藤野賢祐,宗定洋平,西谷雅史,砂子一徳,市川正和,佐藤正士
- 出版社/メーカー: オライリージャパン
- 発売日: 2014/07/19
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (5件) を見る
なぜ読もうと思ったか
...インフラとして今の会社で働いてるけど、
メトリクス分析だのなんだの知って入るけどよくわからん単語もあったりで、
まずなんだっけ?ってなることが幾つか出てきてしまってて
データサイエンティスト担当の人に対して申し訳ないな〜と考えたりしてしまった。
そん時よさ気な、体系的に分かりそうな本は無いかなと思って探したら
オライリーから邦訳された本が合ったので、会社に買ってもらった。
軽く感想
予測モデル、分類器、ツリー帰納法など、それ系について大好きだった
元・同僚から色々と話し聞いていた内容がわかりやすく図が書かれつつ、
短時間で読んである程度把握できるように書かれていた。
SVM(サポートベクターマシン)のマージンの取り方による分類分けについては、
以前話聞いてたし、そうかそうかと思ったり、ロジスティック回帰、ニューラルネットワークそれぞれを使った場合の差が図に一つにまとめられてたりしててわかりやすい。
トレーニングデータに関する、既知の問題をときすぎることによる
オーバーフィッティング問題についても書かれていたり、
累積反応曲線を使ったモデルの有意差とかリフト曲線による分類器の性能(すべてのインスタンス = 行を対象とするか、限られたインスタンスにするか)など
もやもやしてよくわからなかったことも書かれていてすっきりした。
出てきた数学的知識〜については、著者が関数を簡略化して概念を伝えるために
最低限の情報まで数式の情報を切り落としているので、困らなかった。
モデル関数の定義についての説明も加わっているし。
もう少し深く知っていきたいから、他に良い本があるのかな。