前節では、正規分布のパラメータをサンプルデータから推定しました。具体的には、観測データ が得られたとき、次の式に従って正規分布のパラメータを推定しました。
ここでは正規分布の平均を 、標準偏差を という記号で表します(推定した値は のように、「^(ハット)」をつけます)。上式のように、 はサンプルデータの平均、 はサンプルデータの標準偏差として推定します。では、なぜこの計算式で良いのでしょうか?その理由は 最尤推定(Maximum Likelihood Estimation) によって説明がつきます。ここでは最尤推定により上式が導けることを示します。
尤度の最大化
ここにパラメータ によって形状が決まる確率分布があるとします。パラメータ のとき、データ が得られる確率密度は で表されます。
ここでは正規分布に限定せずに、何らかのパラメータ によって分布が決まる確率分布を考えます。正規分布の場合は として考えることができます。
1
次に 個のサンプルデータ が得られた場合を考えます。ここでは各データが独立に生成されると仮定します。このとき 個のデータが得られる確率密度は次の式によって表されます。
各データが独立に生成されると仮定しているため、上式のようにデータごとの確率密度の積として表されます。 は、パラメータが のときサンプルデータ が得られる確率密度を表します。この は 尤度(Likelihood) と呼ばれます。尤度とは「尤(ルビ:もっと)もらしさ」という意味です。
私たちの興味は、サンプルデータ に最もフィットするパラメータ を求めることです。言い換えると、尤度 を最大化するパラメータ を求めるということです。ただし、対数(自然対数)を取るほうが計算上便利なことが多いため、次の対数尤度の最大化を目指します。
対数関数は単調増加関数であるため、 を最大にする の値は、 を最大にする の値と一致します。また、ここで言う「対数」とは、正確には「自然対数」を指します。数式では です。本書では、 を と表記します。
「積の対数」は「対数の和」
2つの数 と の積の対数は、 の対数と の対数の和に等しくなります。数式では次のように表されます。
この公式を使うことで、 の計算が簡単になります。
次に、対数尤度を最大化する方法について見ていきますが、その前に簡単な関数を例にとり、最大値を見つける方法を示します。
微分を使って最大値を探す
ここでは次の関数を対象に最大値の場所を見つける方法を示します。
最大値を見つける際に重要になるのが 微分 です。 の に関する微分は と表され、次のように計算できます。
これより、ある における微分を計算することができます。たとえば、 における微分は です。これは において を微小値 だけ変化させたら は だけ変化するということを意味します。このように、微分は、ある における の「変化の割合」を表します。また、図2-4で示すように微分は接線の傾きに対応します。
図2-4:微分と接線の傾き
図からも分かる通り、グラフは単純な形です。そして、微分値が0の場所に最大値があることがわかります。 これより
1
を解くことで最大値の場所がわかります。その答えは です。
( は定数)のような2次関数は、最大値(もしくは最小値)は数式の解として求まります。これは「解析的(analytically)に解ける」や「閉形式(closed-form)の解が得られる」と言います。
次に尤度関数を最大化する問題について考えます。その解き方はここで示した方法と同じです。対数尤度のパラメータ に関する微分を求め、それを とすることで解析的に解くことができます。その解が式(2.1)と式(2.2)になります。その導出過程を次に示します。
正規分布の最尤推定【★】
復習になりますが、正規分布の確率密度は次の式で表されます。
1
ここで 個の観測データ が得られたとします。そのときの尤度は次の式で表されます。
以上から、対数尤度は次の式で表されます。
に注目すると、対数尤度は の2次関数であることがわかります。この2次関数の最大値は、微分値が の場所にあります。次は微分の計算です。 という記号で表すと、 は次の式で表されます。
2
今回の問題は、 に対して変数が と の2つあります。2変数以上の微分は、「偏微分」として「 」のように表記します。偏微分は、ある変数についてのみ微分を行います。たとえば、 は だけを変数として考え、 それ以外の変数は固定して(つまり定数とみなして)微分します。
1
の最大値の場所は にあります。式展開を進めると、次のように解が求まります。
1
これより、 が のときに最大値を取ることがわかります。ここでは次のように という記号を使って表すことにします。
数式の「⇔」は、2つの式が等価であることを示します。「∴」は結論を示すための記号で、「したがって」という意味があります。
正規分布の平均 は、 のときに対数尤度が最大となることがわかりました。 はサンプルデータの平均です。次は標準偏差 についてです。 の条件のもとで、対数尤度を に関して最大化することが目標です。 のときの対数尤度は次の式で表されます。
の最大値も、 と同じく、解析的に求めることができます。つまり微分を求めて、それを0として数式を展開することで求められます。それでは対数尤度の に関する微分を求めてみましょう。
1
後は、この微分を として、次の式が導かれます。
最後に、ここで求めた標準偏差を という記号を使って次のように表します。
以上、正規分布の最尤推定によりパラメータ推定ができました。
【次ページ 】