(写真:janneke staaks/クリエイティブ・コモンズ表示 2.0 一般)
前回のブログではベイズ統計の最大の強みである、結果の解釈が自然で直感的であるというお話をしました。今回はそれに引き続いてベイズ統計の強みと弱みの説明をしたいと思います。
ベイズ統計の強み(2):柔軟性が高い
通常の頻度論の統計では対応することが難しいときでもベイズ統計では対処可能なことがあります(逆にベイズ統計ではできなくて頻度論の統計では解決できる統計の問題はあまりありません)。我々が最も頻繁に用いる回帰分析は頻度論でもベイズ統計でも解析することができます。回帰分析を例として用います。回帰分析ではβ係数が暴露因子とアウトカムの相関を意味するため、このβ係数を推定することが目的であることが多いです。頻度論統計ではデータの数(サンプルサイズ)よりも求めたいβ係数の個数の方が多いと推定できません。このような時に、ベイズ統計であれば、β係数の確率分布をこちらで決めてあげることで、「サンプルサイズ<求めたいβ係数の個数」の場合でもβ係数をきちんと推定できます
その他、複数の異なる研究のデータを統合する場合(メタアナリシスなど)や、アウトカムの出現率が低いデータにロジスティック回帰分析を行う場合などでは、頻度論統計では難しくても、柔軟性が高いベイズ統計なら対処可能です。頻度論統計で何らかの壁にぶつかった時に、ベイズ統計なら解決できることがあります。
ベイズ統計の弱み(1):モデルが複雑であるため再現性が低い(ブラックボックスになってしまう)
今までベイズ統計の強みをご説明しましたが、ベイズ統計にも弱みがあります。
ベイズ統計の一番の弱みは、モデルが複雑で再現性が低いことだと思います。同じ回帰分析をするのでも、頻度論のモデルであれば統計解析ソフトであっという間に解析できます。誰がやっても同じデータで同じモデルであれば同じ結果が得られます。論文の信頼性に疑問が出たときには、データとプログラムを送ってもらえば結果を再現することができます。そういった意味で、頻度論の解析は「ごまかしがきかない」のです。一方で、ベイズ統計で回帰分析をやると非常に複雑です。回帰分析のβ係数の確率分布などを解析者が決めないといけないので、その仮定(assumption)を変えることで解析結果が変わってしまう可能性があります。例えば、回帰分析を行っていて、β係数が正規分布だと仮定して暴露因子とアウトカムの相関を評価したところ、p=0.2だったとします。そこで、β係数の分布をベータ分布で試したところ、p=0.03になったとします。そして後者をあたかも当初から予定されていた解析方法かのように報告したとしても、モデルが複雑すぎてチェックすることは困難です。そもそも、そのβ係数の確率分布の仮定自体が正しいかどうかを評価する方法もありません。つまり、実際にどのようなことが行われているのか他の研究者には見えづらくなってしまい、解析のモデルがブラックボックスのようになってしまうことが問題です。ちなみに費用効果分析の時に用いられるモデルでも同様の問題が起こります。
図1:正規分布
(出典:Wikipedia)
ベイズ統計の弱み(2):事前分布をどのように設定したら良いか分からない
前回のブログでもお書きした通り、ベイズ統計では「事前分布×データ=事後分布」であり、この事後分布が推定値(つまり我々が知りたいもの)になります。データは客観的なものであり問題ないのですが、事前確率はどこかから取ってこないといけません。頻度論者の中には、「ベイズ統計の事前分布は主観的なものであり、うさんくさい」という考えが根強くありますが、実はこの主張はベイズ統計をあまり理解していない人のロジックです(よく分かっていないゆえになんとなく怖いというのがあるのかもしれません)。ベイズ統計では、ほとんど情報を有していない事前分布(無情報事前分布[Non-informative prior]と呼ぶ)を使うことで、主観的な要素はほとんどなくなるからです。この場合には、事後分布はほとんどデータの持っている情報に依存するようになるので、事前分布があまり役割を果たさなくなるためです。
ただ最近になって、この「困ったら無情報事前分布を使えばよい」という主張も問題があると言っている学者もいます。コロンビア大学のベイズ統計学者であるアンドリュー・ゲルマン教授によると、無情報事前分布を使うことで実際以上に確信的になってしまうため問題であると言っています。(Gelman, 2013)どういうことかというと、ベイズ統計では事後分布は事前分布とデータとの重みづけ平均(weighted average)になります。事前分布に自信があればあるほど(確率分布の分散が小さくなり)、そちらにより大きな重みを与え、事後分布は事前分布に近いものになります。逆に事前分布に自信が無い場合(分散が大きい)、データにより大きな重みを与え、事後分布はデータから得られた分布に近いものになります。無情報事前分布とは、事前分布に全く自信が無い状態ですので、「無情報事前分布を使うことで実際以上に確信的になってしまう」というのは逆説的に聞こえるかもしれませんが、実際にそのような問題があるのです。ゲルマンの論文では、魅力的な両親から生まれた子供の56%は女児で、普通の両親から生まれた子供の48%が女児であったというデータを使ってこれを説明しています。頻度論の統計で解析すると、魅力的な両親の方が女児が生まれる可能性が高いと言う検定のP値は0.2でした。このデータに、無情報事前分布(一様分布=uniform prior)を用いてベイズ統計で解析したところ、事後分布では、魅力的な両親の方が女児が生まれやすい確率は90%となりました。ゲルマンはこの数字はあまりに現実的ではなく、P=0.2とのかい離があまりに大きいとして、無情報事前分布を使ったことで事後分布に「力を与えすぎた」と考えています。ベイズ統計に置いて、無情報事前分布を用いて解析をすること自体に問題があるのかもしれません。
図2:一様分布
(出典:Wikipedia)
頻度論者による「ベイズ統計の事前分布は主観的なものであり、うさんくさい」というロジックは間違いです。主観的であることが嫌なのであれば、無情報事前分布を使えば済むだけです。一方で、無情報事前分布の問題点も最近は指摘されてきているので、単純に困ったら無情報事前分布を使うというのも問題があるようです。
まとめ
ベイズ統計には強みと弱みがそれぞれあります。科学的検証においては再現性があることは非常に重要なので、頻度論の統計で解析できるものであればそちらの方法論を用いるのが良いと個人的には考えています。一方で、頻度論で対処できない問題に直面したときに、ベイズ統計に目を向けることでその障壁を乗り越えることができる可能性があります。いずれにしても、頻度論のベイズ統計のどちらが優れていてどちらが劣っているということではなく、お互いに強みと弱みがあるので、状況に合わせて使い分けることが重要だと考えます。