スレッド

会話

#統計 論文の統計分析の報告部分は部外者が同一の数値をコンピュータで再現し易いように書いてくれると本当に助かる。 社会的に重要な事柄に関する論文は専門外の人達も見る可能性が高いので、そういう点にも気を使って欲しいと思います。 延々と愚痴を書いているな。
2
15
#統計 github.com/genkuroki/publ ワクチンのefficacyのClopper-Pearsonの信頼区間 を大幅に改訂しました。目次がついた。 必要な予備知識は予備知識はPoisson分布や二項分布の統計学だけですが、これを読む前に講義動画 youtu.be/OO9X1SXy_vE を視聴しておくとよいと思います。
2
19
#統計 リスク比の信頼区間の計算を二項分布モデルのClopper-Pearsonの信頼区間に帰着させたり、二項分布のベイズ統計の方法で区間推定したりする方法について数学的にクリアな理解をしたい人にとって、このノートは役に立つと思います。
1
17
#統計 P値(検定)と信頼区間の関係についてクリアに理解していない人が結構いるせいで、宝塚の宮澤氏及び氏を擁護する人達が一方的におバカなことを言っていることに自信を持てない人もいるようなので、信頼区間に関する解説を追加しました。 github.com/genkuroki/publ
画像
画像
1
70
関連 宝塚の宮澤氏とワクチンのefficacyの信頼区間の関係はツイッターで検索すればわかる。反ワクチンの宝塚の宮澤氏はデマを流しまくっています。 さらに、以下の引用ツイートの引用先を見れば、宝塚の宮澤氏がどういう人物か分かります。
引用ツイート
黒木玄 Gen Kuroki
@genkuroki
東北の宮城県在住者の感想。 宮澤大輔氏が有害な人物であることは知っていたが、ここまで真に糞野郎であることは認識していなかった。 twitter.com/kurodoraneko15…
このスレッドを表示
1
29
#統計 よくある 「効果はゼロである」という意味の特定の仮説の検定 とは違って、信頼区間の計算は 「効果はaである」(aは具体的な数値)の型の仮説達の各々について一挙に検定を行うこと と同じであることが、学部生向けの入門書でクリアに解説されていないという改善されるべき大問題があります。
1
27
#統計 信頼区間は効果として棄却されない値a全体の集合になります。 検定では「棄却されないこと」は「仮説の正否に関する判断を保留するべきであること」を意味するので、信頼区間に含まれる効果の値aについての判断を保留することになります。
1
23
#統計 信頼区間に含まれる値について、判断を保留せずに、何か強い結論を述べてしまっている人達は、非常に分かりやすく、おかしなことを言っていることになります。
1
19
学部レベルでの統計学教育の内容が信頼区間のような基本概念の解説レベルで問題を抱えていることを放置したつけが、反ワクチンのデマに対する批判が不徹底になってしまっている原因の1つになっているように思えました。 そういうことの積み重ねが、社会的判断の失敗に繋がり、多くの人を苦しめる。
画像
引用ツイート
黒木玄 Gen Kuroki
@genkuroki
#統計 よくある 「効果はゼロである」という意味の特定の仮説の検定 とは違って、信頼区間の計算は 「効果はaである」(aは具体的な数値)の型の仮説達の各々について一挙に検定を行うこと と同じであることが、学部生向けの入門書でクリアに解説されていないという改善されるべき大問題があります。
このスレッドを表示
1
24
#統計 TM_Quencherさん、どうもありがとうございます! 自分では全然気付きませんでした! ついさっき直しました。 github.com/genkuroki/publ
画像
引用ツイート
TM_Quencher
@TM_Quencher
返信先: @genkurokiさん
改訂した直後で申し訳ないのですが、こちらの解説では接種群とプラセボ群がc0とc1のそれぞれどちらに対応するかが途中で入れ替わっていないでしょうか?
1
15
#統計 相互リンク
引用ツイート
黒木玄 Gen Kuroki
@genkuroki
返信先: @TsugawaYusukeさん
#統計 目立ち難い場所での返信でコメントさせて下さい。少し長くなります。 パラメータθの信頼度1-α信頼区間の1つの定義は、  仮説「θ=a」のP値がα以上になる値a全体の集合 です。 だから、信頼区間の計算は「θ=a」の型の仮説全体に一挙に検定の手続きを適用することと同じになります。 続く
画像
1
4
#統計 以下のスレッドに賛成意見が見られることは、個人的には非常に残念なことでした。 なぜならば、信頼区間と検定の関係の理解について肝腎な点が曖昧でミスリーディングな説明の仕方になっていると思ったからです。 以下で詳しくコメントして行きます。
引用ツイート
Yuki FURUSE 古瀬祐気
@ykfrs1217
主張は置いておいて、やり取りのしかたも置いておいて、検定とか信頼区間のイロハについてはいい題材だなと思いました。自分なりに、どこでつっかかっているのか考えてみました ① 検定とは、(帰無)仮説の評価である ② 信頼区間を求めることで検定につながる。求めることは検定ではない 1/6 twitter.com/blanc0981/stat…
このスレッドを表示
画像
画像
1
13
#統計 【①検定とは、(帰無)仮説の評価である】 これは間違いではないですが、【(帰無)仮説】としてどのようなものを想定しているかが不明瞭すぎてミスリーディングだと思います。 多くに人達は、検定と言えば、「効果はゼロである」という型の帰無仮説の評価のことだと強く思い込んでいます。続く
引用ツイート
Yuki FURUSE 古瀬祐気
@ykfrs1217
主張は置いておいて、やり取りのしかたも置いておいて、検定とか信頼区間のイロハについてはいい題材だなと思いました。自分なりに、どこでつっかかっているのか考えてみました ① 検定とは、(帰無)仮説の評価である ② 信頼区間を求めることで検定につながる。求めることは検定ではない 1/6 twitter.com/blanc0981/stat…
このスレッドを表示
画像
画像
返信先: さん
#統計 それだと、検定と(例えばワクチンのefficacyの)信頼区間の関係をまともに理解できなくなります。 検定と信頼区間の関係を理解するためには、「効果はaである」(aは具体的な数値)の型の仮説の評価も検定で可能なことを強調する必要があります。
1
6
#統計 【②信頼区間を求めることは検定につながる。求めることは検定ではない】も間違いではないですが、細部が曖昧すぎて教育的には有害なくらいミスリーディングだと思いました。 その理由はこのスレッド全体と関連スレッド達をすでに読んだ読者には明らかだと思いますが、以下で再度説明します。
引用ツイート
Yuki FURUSE 古瀬祐気
@ykfrs1217
主張は置いておいて、やり取りのしかたも置いておいて、検定とか信頼区間のイロハについてはいい題材だなと思いました。自分なりに、どこでつっかかっているのか考えてみました ① 検定とは、(帰無)仮説の評価である ② 信頼区間を求めることで検定につながる。求めることは検定ではない 1/6 twitter.com/blanc0981/stat…
このスレッドを表示
画像
画像
1
5
#統計 効果の指標θ(統計モデルのパラメータの1つ)の信頼度1-αの信頼区間の1つの定義は、  データの数値によって仮説θ=aが  有意水準αの検定で棄却されない値a全体の集合 です。この意味では、定義から自明に、信頼区間の計算は検定を(無数に)行うことと同じことになります。 続く
1
10
#統計 【②信頼区間を求めることは検定につながる。求めることは検定ではない】は確かに誤りとは言えないかもしれませんが、「データの数値によって仮説θ=aが有意水準αの検定で棄却されない値a全体の集合」という信頼区間の定義との整合性への配慮に欠けていることは明らかで問題ありだと思います。
1
8
#統計 以下のリンク先の③もひどく曖昧です。 信頼区間の計算に使われるのは「データの数値(数表)」であり、【分布】のような曖昧な呼び方はやめるべきです。 信頼度1-αの信頼区間の計算には (1)データの数値 (2)仮説θ=aの有意水準αでの検定法と同等の情報 が使われます。続く
引用ツイート
Yuki FURUSE 古瀬祐気
@ykfrs1217
③ 個々の観察事象から"%"が測定できるとき:例えば各地で海水を採集して塩分濃度を測れば、その分布から信頼区間が求められる。これ自体は検定ではない。「10%だ」という仮説があるのであれば、結果から検定をすることはできる 2/6
このスレッドを表示
1
7
#統計 「仮説θ=aの有意水準αでの検定法と同等の情報」が信頼区間の計算で使われることを認識できていれば、以下のリンク先の③のような書き方はできないと思います。
引用ツイート
Yuki FURUSE 古瀬祐気
@ykfrs1217
③ 個々の観察事象から"%"が測定できるとき:例えば各地で海水を採集して塩分濃度を測れば、その分布から信頼区間が求められる。これ自体は検定ではない。「10%だ」という仮説があるのであれば、結果から検定をすることはできる 2/6
このスレッドを表示
1
6
#統計 以下のリンク先の④Aもひどく曖昧です。 ORやRRの点推定として"%"を求める話をしているようにも見えますが、それだと区間推定(信頼区間)の話にならない。 信頼区間の計算では実質的に、仮説OR=ωや仮説RE=ρの有意水準αでの検定法と同等の情報が使われることを認識している気配が全くない。
引用ツイート
Yuki FURUSE 古瀬祐気
@ykfrs1217
④A ワクチン有効率は集計結果から"%"を求めている。「ワクチン接種者が感染した」という1つの事象に"%"はない。有効率の計算にはRRあるいはORを用いるため、計算結果には「接種者/非接種者」あるいは「感染者/非感染者」の"違い(差、比較)"が内包されている 3/6
このスレッドを表示
1
4
#統計 ④Bでも【求められた値そのものの差(違い)】が点推定値なのかそうでないかが曖昧すぎる。 そして、信頼区間の計算そのものがOR=ωやRR=ρの型の無数の仮説達の有意水準αでの検定を一挙にまとめてやった結果になっていることへの配慮が全くない。
引用ツイート
Yuki FURUSE 古瀬祐気
@ykfrs1217
④B 求めた信頼区間は検定を強いるものではないが、求められた値そのものが差(違い)について述べている ④C また、差がないときのRRやORが1になること自体は仮説ではなく事実である。仮説をどう設定しようとも信頼区間が変化するわけではない 4/6
このスレッドを表示
1
4
#統計 ④C全体は、もはやどうしてこういうコメントが挿入されているかが理解不能。
引用ツイート
Yuki FURUSE 古瀬祐気
@ykfrs1217
④B 求めた信頼区間は検定を強いるものではないが、求められた値そのものが差(違い)について述べている ④C また、差がないときのRRやORが1になること自体は仮説ではなく事実である。仮説をどう設定しようとも信頼区間が変化するわけではない 4/6
このスレッドを表示
1
5
#統計 信頼区間を示した途端に、RR=ρの型の仮説やOR=ωの型の仮説が検定では棄却されないρやωの値全体が明らかになっていることを認識できていれば、以下のリンク先の④D前半のようなことを言えるはずがない。
引用ツイート
Yuki FURUSE 古瀬祐気
@ykfrs1217
④D 結果をもとに第三者が「ワクチンに効果がない(RRやORが1になる)」ことを自由に"検定"できることに、P値ではなく信頼区間を示す良さがある このどこかで誤解があるか、あるいはそんなに誤解もしてなくて統計的な解釈のしかた(立場)の問題のような気も… 5/6
このスレッドを表示
1
4
#統計 以下のツイートに連なるスレッドの内容に賛成の人が多そうに見えること(いいねの数などに注目)を、私は非常に残念に思いました。 多分、我々は大学学部レベルの統計学教育に問題を抱えています。 論文 journals.sagepub.com/doi/10.1177/02 のような議論がもっと広まって欲しいです。
画像
引用ツイート
Yuki FURUSE 古瀬祐気
@ykfrs1217
画像
画像
④Dにおいて、仮説を設定した主体に不満があるのかもしれませんが、両者の興味はそこで一致していると思うので問題にすることではなさそうだけどなー >まだやってるんですか お。釣り針がおいしそうだったので 6/6
このスレッドを表示
1
13
#統計 検定と信頼区間が表裏一体であることは有名な教科書達にも書いてあります。 しかし、学部生向けの多くの入門的教科書では、信頼区間の解説が検定の解説の前に書いてあって、信頼区間と検定の表裏一体性には一切触れずに終わる。 信頼区間の解釈をまともにできない人が多いことの原因の1つ。
引用ツイート
黒木玄 Gen Kuroki
@genkuroki
#統計 信頼区間と検定が表裏一体であることの説明が書いてある有名な教科書 竹内啓『数理統計学』p.103 竹村彰通『現代数理統計学』p.202 久保川達也『現代数理統計学の基礎』p.169 小針晛宏『確率・統計入門』p.197 twitter.com/genkuroki/stat…
このスレッドを表示
画像
画像
画像
画像
1
10
#統計 関連スレッド
引用ツイート
黒木玄 Gen Kuroki
@genkuroki
#統計 P値函数入門には、ついさっき書き上げた nbviewer.org/github/genkuro 比率のP値函数達 がお勧め。 Wilson, Wald, Clopper-Pearson, Sterneの4種のP値函数と信頼区間のグラフと実装例と解説が書いてある。 Wilsonの信頼区間が良い性質を持っているのですが、十分に紹介されていない感じ。
このスレッドを表示
画像
画像
画像
画像
1
4
#統計 Greenlandさん達が推し進めているcompatibility intervalとしての信頼区間の解釈は、そのままベイズ統計での信用区間にも拡張されます。 ただし、ベイズ信用区間に関するcompatibilityは事前分布も含めてのデータの数値との「両立性」「相性の良さ」だと解釈する必要がある。
1
5
#統計 compatibilityの解釈の普遍性を理解できてかつ拡張も容易であることを知ると、通常の信頼区間とベイズ版信用区間について解釈の違いを無用に強調することは統計学の実践的運用において有害であることがわかります。 主義に基くベイズ統計の発想にはそろそろ引導を渡すべき。
1
4
#統計 例えば、3×4=3+3+3+3、4×3=4+4+4と定義したとき、3×4を4+4+4の意味で使ってはいけないと子供に強制する行為は子供を害しています。 それと同じようなことが、通常の信頼区間とベイズ信用区間について起こっているように見える。定義が全然違っていても条件が揃えば同じ解釈をしてよい。
引用ツイート
黒木玄 Gen Kuroki
@genkuroki
#統計 信頼区間の解説でいつも困ったことだと思ってみているのは、通常の信頼区間の解釈の説明に続けて、多くの場合に、ベイズ版信用区間の解釈は異なるという話を極めて不適的な方法でしている人達が「自分はまともです」という態度を取っていることです。続く github.com/genkuroki/publ
このスレッドを表示
画像
画像
1
7
#統計 数学を実践的に使う場合には「ぴったり等しい」という条件にこだわることは有害である場合が多く、どのような場合に「近似的に等しい」と言えるかという発想が重要になります。 条件が揃えば、信頼区間とベイズ信用区間は近似的によく一致します。そういう状況で定義の違いにこだわるのは愚策。
1
8
#統計 行列などのかけ算の可換性が成立しない場合がある。そういう場合にはかけ算の順序を気にすればよい。 通常の信頼区間とベイズ信用区間の間に実践的に無視できない違いが生じる場合には、それぞれを別に解釈すればよい。 難しく考えずにケースバイケースでシンプルに考えればよい。
1
9
#統計 関連スレッド
引用ツイート
黒木玄 Gen Kuroki
@genkuroki
#統計 二項分布モデルの場合の * WilsonのP値函数 * Clopper-PearsonのP値函数 * 一様事前分布のベイズ統計でのP値函数の類似物 の同時プロット。 通常のP値函数であるClopper-PearsonとWilsonとの違いとBayesianとの違いは同じ程度。 #Julia言語 ソースコード nbviewer.org/github/genkuro
このスレッドを表示
画像
画像
1

Twitterを使ってみよう

今すぐ登録して、タイムラインをカスタマイズしましょう。
アカウントを登録することにより、利用規約プライバシーポリシーCookieの使用を含む)に同意したとみなされます。

トレンド

いまどうしてる?

ニュース
ライブ
中国共産党大会が開幕
エンターテインメント · トレンド
北海道美瑛町
フジテレビ系ドラマ『PICU小児集中治療室』の内容が、北海道美瑛町の医療体制への誤解を招くとして、同町がフジテレビに抗議したことが17日、分かったと北海道新聞が報じました。フジテレビ側は「対応を検討する」とのことです。
トレンドトピック: 町の医療体制
政治 · トレンド
#安倍さん暗殺
2,006件のツイート
国際ニュース
ライブ
ロシアによるウクライナへの侵攻状況
テレ朝news
昨日
タイ“浸水レストラン”客にぎわうも…大規模洪水 温暖化で被害深刻か