2009-08-05 パターン認識と機械学習(PRML)読書会
PRML読書会 #5 資料「線形識別モデル(1)」
これは パターン認識と機械学習(PRML)読書会 #5 (4章 線形識別モデル) での発表用の資料「4.1 識別関数」〜「4.1.2 多クラス」です。
まとめメインで、細かい説明/計算やサンプルは板書する予定。
【更新】読書会での指摘を反映。
まとめメインで、細かい説明/計算やサンプルは板書する予定。
【更新】読書会での指摘を反映。
PRML 4章 線形識別モデル
- 2クラス分類 [4.1.1]
- 多クラス分類 [4.1.2]
- 最小二乗による学習 [4.1.3]
- フィッシャーの線形判別による学習 [4.1.4-6]
- パーセプトロン・アルゴリズムによる学習 [4.1.7]
- おまけ
分類問題
線形識別モデル
決定面が superplane
- 線形モデル
- 一般化線形モデル
- 非線形モデル
- 難しい
1-of-K 表記法
分類問題において、目的変数を
- K=2 のとき
- の場合 t=1
- の場合 t=0
- K>2 のとき
- の場合
問題に応じて取り方も工夫 [4.1.5, 4.1.7]
アプローチ [cf. 1.5.4]
- 識別関数 (discriminant function) [4.1]
- 入力から直接決定関数を学習する
- 確率的識別モデル (discriminative model) [4.3]
- 事後確率 を求める推論問題を解く
- 確率的生成モデル (generative model) [4.2]
- クラスの条件付き密度 を決める推論問題を解き、ベイズの定理により事後確率 を求める
4.1 識別関数 (discriminant function)
4.1.1 2クラス
- なら に、 なら に分類
- decision surface は
w をどうやって決めるかは 4.1.3 以降
decision surface までの距離
原点から
r : からdecision surface までの距離
-
- : decision surface への直交射影とすると
- を y に代入
4.1.2 多クラス
K>2 個のクラスへの分類
- 1対多分類器
- 1対1分類器
1対多分類器
1対1分類器
, (k=1,...,K)
- 全ての について なら に分類
- decision surface は ( 個)
- decision region は凸領域
- 領域内の任意の2点を結ぶ線分が 領域に含まれる
多クラス分類器の問題点
- 曖昧な分類領域が存在する
- 1対多も1対1も「2クラス問題の拡張」方式ゆえ
- K個の分類器によるKクラス分類によってそれを解決する
- 入力 は が最大となる に割り当てる
- 4.1.3 ではその考え方で分類する
- Passive Aggressive Algorism での multiclass classification も同様( の値を confidence として用いることができることを示す)
パラメータの学習方法
*1:★は独自の注釈や意見や疑問や感想