#統計 添付画像は nejm.org/doi/10.1056/NE のTable 3 です。
ワクチンのefficacyに関するsurveillance timeで補正したClopper-Pearsonの信頼区間の前提となる統計モデルや定義を明瞭にするためのノートを作りました。
↓
github.com/genkuroki/publ
ワクチンのefficacyのClopper-Pearsonの信頼区間
Thread
Conversation
Replying to
#統計 しかし、微小に数値がずれる。
出力の右側が論文の表と私による計算の差。
全部0.0になって欲しかったのだが、そうなっていない。
こういうことは非常によくある!!!
理由がわかった人がいれば教えて下さい。
github.com/genkuroki/publ
1
4
#統計 以下のリンク先のような疑問はこのスレッドで紹介したノート github.com/genkuroki/publ を読めば解消するはずです。
ワクチン接種群とプラセボ群で独立なPoisson過程モデルを採用して、条件付き確率分布として出て来る二項分布に帰着する方法を使っています。続く
Quote Tweet
TM_Quencher
@TM_Quencher
Replying to @morilyn1123
割合ではなく率比にClopper-Pearsonを適用する為にはベータ分布を仮定する必要がある、という意味であっていますか?
ベータ分布でなければどのような事前分布を仮定するのか分かりませんが、Clopper-Pearsonは保守的な範囲を出すのでVEの信頼区間を推定する方法としては悪くないと思いますが。
1
5
#統計 条件付き確率分布における確率の正確な計算によって定義される信頼区間(例えば二項分布モデルでのClopper-Pearsonの信頼区間)は被覆確率が確実に1-α以上になるという保守的な性質(これは利点)を持っています。
その裏返しとして無駄に広くなりやすいという欠点を持つことになる。
1
4
#統計 Clopper-Pearsonの信頼区間の計算でベータ分布が使われるのは、ベータ分布を仮定しているからではなく、二項分布の累積分布函数がベータ分布の累積分布函数で書けるという数学的結果を使っているからです。
二項分布モデルだけからClopper-Pearsonの信頼区間は出て来ます。
1
2
10
#統計 ただし、件の場合には、二項分布モデルから出発しているのではなく、独立な2つのPoisson過程モデルの条件付き確率分布として二項分布が出て来ている。
条件付き確率分布を使う保守的な検定法の構成は、2×2の分割表でのFisher検定の構成でも使われており、基本定跡の1つになっています。
1
5
#統計 以下のリンク先スレッドトップでは snap-tck.com/room04/c01/vac を引用していますが、条件付き検定になっていることや、保守的な性質への言及がなく、少しミスリーディングな説明になっているので、あまり参考にしない方がよいと思いました。
Quote Tweet
TM_Quencher
@TM_Quencher
Replying to @morilyn1123
割合ではなく率比にClopper-Pearsonを適用する為にはベータ分布を仮定する必要がある、という意味であっていますか?
ベータ分布でなければどのような事前分布を仮定するのか分かりませんが、Clopper-Pearsonは保守的な範囲を出すのでVEの信頼区間を推定する方法としては悪くないと思いますが。
1
5
#統計 少しググってみたら、ワクチンのefficacyの信頼区間の複数の構成法を比較している論文として、 frontiersin.org/articles/10.33 が見つかりました。
こちらの論文を読めば統計モデルをどう取ればよいかもわかります。(しかし、たぶん、私による解説 github.com/genkuroki/publ の方がクリアだと思う。)
1
4
#統計 パラメータ付きの確率分布として統計モデルを与えて、信頼区間を計算したいパラメータはそのモデルのどのパラメータで、残りのnuisanceパラメータをどのように処理したかについてきちんと説明を書いてくれれば、P値や信頼区間の計算法が確定します。
論文にもそういう説明があるとうれしい。
1
6
#統計 論文の書き方を見て「ほぼこれで間違いないだろう」と思った方法で計算しても、微小に数値が合わないことが非常によくあって、かなり気持ち悪いです。
自分の側に問題があるのかどうかよくわからないことが多い。
論文の結論に影響がなければそのまま放置することになるが、気持ち悪さは残る。
1
1
10
#統計 論文の統計分析の報告部分は部外者が同一の数値をコンピュータで再現し易いように書いてくれると本当に助かる。
社会的に重要な事柄に関する論文は専門外の人達も見る可能性が高いので、そういう点にも気を使って欲しいと思います。
延々と愚痴を書いているな。
2
11
#統計
github.com/genkuroki/publ
ワクチンのefficacyのClopper-Pearsonの信頼区間
を大幅に改訂しました。目次がついた。
必要な予備知識は予備知識はPoisson分布や二項分布の統計学だけですが、これを読む前に講義動画 youtu.be/OO9X1SXy_vE を視聴しておくとよいと思います。
1
2
3
#統計 github.com/genkuroki/publ は2020年の論文 nejm.org/doi/10.1056/NE での信頼区間の計算の仕方の解読のために書かれたノートです。
他の信頼区間の定義との比較は frontiersin.org/articles/10.33 にあります。
1
1
2
#統計 リスク比の信頼区間の計算を二項分布モデルのClopper-Pearsonの信頼区間に帰着させたり、二項分布のベイズ統計の方法で区間推定したりする方法について数学的にクリアな理解をしたい人にとって、このノートは役に立つと思います。
1
1
2
#統計 P値(検定)と信頼区間の関係についてクリアに理解していない人が結構いるせいで、宝塚の宮澤氏及び氏を擁護する人達が一方的におバカなことを言っていることに自信を持てない人もいるようなので、信頼区間に関する解説を追加しました。
github.com/genkuroki/publ
1
1
4
関連
宝塚の宮澤氏とワクチンのefficacyの信頼区間の関係はツイッターで検索すればわかる。反ワクチンの宝塚の宮澤氏はデマを流しまくっています。
さらに、以下の引用ツイートの引用先を見れば、宝塚の宮澤氏がどういう人物か分かります。
Quote Tweet
黒木玄 Gen Kuroki
@genkuroki
東北の宮城県在住者の感想。
宮澤大輔氏が有害な人物であることは知っていたが、ここまで真に糞野郎であることは認識していなかった。 twitter.com/kurodoraneko15…
Show this thread
1
1
2
#統計 よくある
「効果はゼロである」という意味の特定の仮説の検定
とは違って、信頼区間の計算は
「効果はaである」(aは具体的な数値)の型の仮説達の各々について一挙に検定を行うこと
と同じであることが、学部生向けの入門書でクリアに解説されていないという改善されるべき大問題があります。
1
3
New to Twitter?
Sign up now to get your own personalized timeline!
Trending now
What’s happening
Sports
LIVE
プロ野球
15日 オリックス vs. ソフトバンク
Music · Trending
#YetToComeinBUSAN
1.41M Tweets
テレ朝news
1 hour ago
「最新iPhoneほしい」最安でも10万円超“親子バトル”… トルコでは世界最高額の45万円「車が買える」
Trending in Japan
落選メール
2,391 Tweets
東洋経済オンライン
3 hours ago
相方ブレークで「麒麟」田村裕が思うコンビの意味