Thread

Conversation

#統計 ❤️信頼区間の解釈の仕方に関するスレッドのまとめ❤️ (1) 以下のリンク先スレッドでは、 仮説θ=aのP値が5%以上になる値a全体の集合 が パラメータθの95%信頼区間 になることを説明した。 その関連で伝統的な「信頼区間警察」達がどうして有害かについても別スレッドで詳しく説明した。続く
Quote Tweet
黒木玄 Gen Kuroki
@genkuroki
#統計 信頼区間と検定が表裏一体であることの説明が書いてある有名な教科書 竹内啓『数理統計学』p.103 竹村彰通『現代数理統計学』p.202 久保川達也『現代数理統計学の基礎』p.169 小針晛宏『確率・統計入門』p.197 検定と信頼区間の表裏一体性を知らない人には「教科書読め!」と言えば十分。
Show this thread
Image
Image
Image
Image
Replying to
#統計 (2) 以下のスレッドでは  繰り返し標本を抽出して95%信頼区間を計算し直すと  その中で真の値を含む区間の割合は95%になる という説明を押し付ける「信頼区間警察」達の2つの問題を指摘した。 ①統計モデルの妥当性に無頓着 ②検定と信頼区間の表裏一体性に基く解釈から目をそらしている
Quote Tweet
黒木玄 Gen Kuroki
@genkuroki
#統計 以下の続き。「信頼区間警察」による  繰り返し標本を抽出して95%信頼区間を計算し直すと  その中で真の値を含む区間の割合は95%になる という説明もよく見ますが、これも  誤りとまでは言えないかもしれないが、  複数通りの意味でもよくない説明の仕方 です。以下はその解説。 twitter.com/genkuroki/stat…
Show this thread
1
3
#統計 (3) 以下のスレッドでは 95%信頼区間に真の値が含まれる確率を95%だとすることは誤解だが、ベイズ信用区間であれば正しい とする「信頼区間警察」達の問題を指摘した。 * 多くの場合に信頼区間とベイズ信用区間は近似的に一致する * その「真の値」は現実の問題における真の値ではない
Quote Tweet
黒木玄 Gen Kuroki
@genkuroki
#統計 私が最悪だと思っていることの1つは、「信頼区間警察」が 95%信頼区間に真の値が含まれる確率を95%だとすることは誤解だが、ベイズ信用区間であれば正しい のように言うことです。続く twitter.com/genkuroki/stat…
Show this thread
1
3
#統計 今回の件で、 (*)信頼区間が仮説θ=aが棄却されない値a全体の集合になること を正しく説明できた人達であっても、この(*)の理解を阻害して来た「信頼区間警察」行為を行なっている場合がある様子は非常に印象的。 反省して「信頼区間警察」を批判する側に回って欲しいです。
1
3
#統計 P値に関するASA声明 biometrics.gr.jp/news/all/ASA.p では「統計モデル」=「P値の計算の背後にある仮定全体」の妥当性に無頓着になる誤りについて繰り返し指摘。 θに関する95%信頼区間は仮説θ=aのP値が5%以上になる値a全体の集合なので、統計モデルの妥当性に無頓着になる誤りを防ぐことは重要です。
1
4
#統計 真っ当な統計学の使用という観点から、「信頼区間警察」行為を眺めると、「統計モデル」=「信頼区間の計算の背後にある仮定全体」の妥当性の確認が難しいことについてひどく無頓着であることがわかります。 P値ではなく、信頼区間についてのASA声明が必要かもしれません。
1
3
#統計 例えば、データの数値からリスク比に関する95%信頼区間を計算したとします。 単純な統計モデルで信頼区間を計算した場合には、母集団全体からの無作為抽出などを数学的に仮定しているはずです。現実には偏った母集団からの標本抽出になっていることが多く、偏りを完全に無くすのは無理。続く
1
3
#統計 だから、現実の研究では、データの取得時に偏りをできるだけ無くすような工夫と偏りを後で補正できるようにする工夫を同時に実行して、統計分析時に使う統計モデルをより複雑なものにして偏りを補正しようとしたりするわけです。 こういう現実と「信頼区間警察」行為の乖離は非常に大きい。続く
1
3
#統計 「信頼区間警察」行為で発せられる信頼区間に関する説明は多くの場合に、単純な統計モデルが不適切になっている可能性に常に細心の注意を払うべきであることへの理解を妨害しています。 そういう行為を放置するのは非常にまずいと思います。
1
3
#統計 「信頼区間警察」行為の有害性について説明しながら、そういう有害行為を平気で行う人達のリストを想起すると、「本当は有害行為だと理解できるだけの知識を持っているはずなのに!」と思わざるを得ません。 「人間は伝統的な説明の仕方の権威に弱い」ということなのだと思っています。
1
6
#統計 「信頼区間警察」行為は明らかに統計学の知識を十分に持っているように見える人達も平気でやっているのでタチが悪い。 自分自身は統計学に詳しいと自負している人が「信頼区間警察」行為を反省することは、その自負があるゆえに難しくなっているのかもしれません。
1
4
#統計 「95%信頼区間に真の値が含まれる確率が95%になると考えるのは誤解であるが、ベイズ統計における95%信用区間であれば真の値が95%の確率で含まれると考えてよい」のようなベイズ信用区間の過剰広告に騙されていそうな人は以下のリンク先を見て下さい。
Quote Tweet
黒木玄 Gen Kuroki
@genkuroki
#統計 ベイズ信用区間が「真の値」を含む確率の定義は事後分布で測った区間に含まれる確率に過ぎない。過剰広告に騙されないように注意して下さい。 95%信頼区間にベイズ信用区間と同様の意味で「真の値」が含まれる確率は95%でよく近似されます。添付画像を参照。 nbviewer.org/github/genkuro
Show this thread
Image
Image
Image
1
4
#統計 信頼区間と同じ意味での被覆確率での通常の信頼区間とベイズ信用区間の比較 ↓
Quote Tweet
黒木玄 Gen Kuroki
@genkuroki
#統計 事前分布をBeta(1.5, 1.5)にするとさらに似た感じになる。 二項分布モデルの場合にベイズ信用区間を通常の信頼区間と全く同じ使い方をすることに躊躇する理由はないと思う。 こういう計算結果を突き付けられても、ベイズだから違うと言い張るのは馬鹿げています。 nbviewer.org/github/genkuro
Show this thread
Image
1

New to Twitter?

Sign up now to get your own personalized timeline!
Sign up with Apple
Sign up with phone or email
By signing up, you agree to the Terms of Service and Privacy Policy, including Cookie Use.

Trending now

What’s happening

News
LIVE
中国共産党大会が開幕
Politics · Trending
#安倍さん暗殺
2,070 Tweets
Trending in Japan
キングダムの時
World news
LIVE
ロシアによるウクライナへの侵攻状況
テレ朝news
Yesterday
タイ“浸水レストラン”客にぎわうも…大規模洪水 温暖化で被害深刻か