#統計 添付画像は nejm.org/doi/10.1056/NE のTable 3 です。
ワクチンのefficacyに関するsurveillance timeで補正したClopper-Pearsonの信頼区間の前提となる統計モデルや定義を明瞭にするためのノートを作りました。
↓
github.com/genkuroki/publ
ワクチンのefficacyのClopper-Pearsonの信頼区間
Thread
Conversation
Replying to
#統計 しかし、微小に数値がずれる。
出力の右側が論文の表と私による計算の差。
全部0.0になって欲しかったのだが、そうなっていない。
こういうことは非常によくある!!!
理由がわかった人がいれば教えて下さい。
github.com/genkuroki/publ
1
3
#統計 以下のリンク先のような疑問はこのスレッドで紹介したノート github.com/genkuroki/publ を読めば解消するはずです。
ワクチン接種群とプラセボ群で独立なPoisson過程モデルを採用して、条件付き確率分布として出て来る二項分布に帰着する方法を使っています。続く
Quote Tweet
TM_Quencher
@TM_Quencher
Replying to @morilyn1123
割合ではなく率比にClopper-Pearsonを適用する為にはベータ分布を仮定する必要がある、という意味であっていますか?
ベータ分布でなければどのような事前分布を仮定するのか分かりませんが、Clopper-Pearsonは保守的な範囲を出すのでVEの信頼区間を推定する方法としては悪くないと思いますが。
1
3
#統計 条件付き確率分布における確率の正確な計算によって定義される信頼区間(例えば二項分布モデルでのClopper-Pearsonの信頼区間)は被覆確率が確実に1-α以上になるという保守的な性質(これは利点)を持っています。
その裏返しとして無駄に広くなりやすいという欠点を持つことになる。
1
3
#統計 Clopper-Pearsonの信頼区間の計算でベータ分布が使われるのは、ベータ分布を仮定しているからではなく、二項分布の累積分布函数がベータ分布の累積分布函数で書けるという数学的結果を使っているからです。
二項分布モデルだけからClopper-Pearsonの信頼区間は出て来ます。
1
1
5
#統計 ただし、件の場合には、二項分布モデルから出発しているのではなく、独立な2つのPoisson過程モデルの条件付き確率分布として二項分布が出て来ている。
条件付き確率分布を使う保守的な検定法の構成は、2×2の分割表でのFisher検定の構成でも使われており、基本定跡の1つになっています。
1
4
#統計 以下のリンク先スレッドトップでは snap-tck.com/room04/c01/vac を引用していますが、条件付き検定になっていることや、保守的な性質への言及がなく、少しミスリーディングな説明になっているので、あまり参考にしない方がよいと思いました。
Quote Tweet
TM_Quencher
@TM_Quencher
Replying to @morilyn1123
割合ではなく率比にClopper-Pearsonを適用する為にはベータ分布を仮定する必要がある、という意味であっていますか?
ベータ分布でなければどのような事前分布を仮定するのか分かりませんが、Clopper-Pearsonは保守的な範囲を出すのでVEの信頼区間を推定する方法としては悪くないと思いますが。
1
3
#統計 少しググってみたら、ワクチンのefficacyの信頼区間の複数の構成法を比較している論文として、 frontiersin.org/articles/10.33 が見つかりました。
こちらの論文を読めば統計モデルをどう取ればよいかもわかります。(しかし、たぶん、私による解説 github.com/genkuroki/publ の方がクリアだと思う。)
1
3
#統計 パラメータ付きの確率分布として統計モデルを与えて、信頼区間を計算したいパラメータはそのモデルのどのパラメータで、残りのnuisanceパラメータをどのように処理したかについてきちんと説明を書いてくれれば、P値や信頼区間の計算法が確定します。
論文にもそういう説明があるとうれしい。
1
4
#統計 論文の書き方を見て「ほぼこれで間違いないだろう」と思った方法で計算しても、微小に数値が合わないことが非常によくあって、かなり気持ち悪いです。
自分の側に問題があるのかどうかよくわからないことが多い。
論文の結論に影響がなければそのまま放置することになるが、気持ち悪さは残る。
1
1
7
#統計 論文の統計分析の報告部分は部外者が同一の数値をコンピュータで再現し易いように書いてくれると本当に助かる。
社会的に重要な事柄に関する論文は専門外の人達も見る可能性が高いので、そういう点にも気を使って欲しいと思います。
延々と愚痴を書いているな。
1
9
New to Twitter?
Sign up now to get your own personalized timeline!