#統計 その図はとても良い図。(縮尺は雑くても定性的なことは分かるし、縮尺を正確にすれば正確な様子も直観的に分かるようにできる)
ぱっと見て全体の様子が分かることの方が、最初にミスリードさせることを導入部分とする浅はかなレトリックを使った解説よりも重要。
スレッド
新しいツイートを表示
会話
#統計 条件付けがない場合の全体の確率の様子の記述を最初に見せずに、
罹患/非罹患による条件付き確率分布だけを見せる
ことによって、
誤解を誘ったり、直観が効かない状況を作って
から、
正しい答えばベイズの定理から出る
と解説するのはやめた方が良いと私は思います。
#統計 私が作った図
#統計
左側の赤色
の部分は、罹患者達。
右側の青色
の部分は、非罹患者達。
赤の三角は検査陽性者達。
青の三角も検査陽性者達。
それ以外の四角は全部検査陰性者達。
非罹患者なのに検査陽性になる人は非常に少なくても、罹患者の割合が少ないと、陽性者内での非罹患者の割合が高くなり得る。
#統計 続き。というようなことは、ミスリードから始めるベイズの定理の悪しき解説を無視して、全体の様子がよく分かるような図をいくつか描いた方がよく理解できます。
当たり前のことを驚くべきことだと誤解せずに、当たり前のことだと理解することが大事。
具体的には、ヨビノリたくみ氏によるベイズの定理の解説を分かりやすくて素晴らしいと感じた人達は、より直観的で分かりやすい考え方があることを想像できなかった人達だということになります。
そういう不十分な理解に基く絶賛は何らかの方法で社会的に弱められるべきだと私は思いました。
ヨビノリたくみ氏がベイズの定理についてよろしくない解説を流布したことを明示的に認めた上で、改善版の素晴らしい動画解説を作ってくれて、アクセスも伸びれば素晴らしいと思います。
他にもそうするべき動画は沢山あると私は思っています。
条件付き確率の概念さえ理解できていれば困らないし、条件付き確率の概念は「全体ではなく部分に対する割合」にすぎないことについて書いたスレッド
↓
引用ツイート
黒木玄 Gen Kuroki
@genkuroki
返信先: @__KAMIWAFU__さん
はい、不適切です。
ベイズの定理よりも条件付き確率の概念の方が基礎的でかつ直観的でかつ応用先も広く、ベイズの定理は知らなくても困らない自明な結果にすぎないことを視聴者達が理解できるように説明しないと、教育動画としては非常によろしくないです。
離散分布での条件付き確率の概念は本当に易しい。
全体ではなく部分に対する割合を考えるだけです。
しかし、連続分布の場合には数学的にちょっと非自明かもしれません。
しかし、その場合も以下のリンク先の2×2の分割表的な発想で理解できます。
↓
#統計 xy平面上の確率密度函数p(x,y)が与えられているとき、任意にyを固定して、xに関する条件付き確率分布を考えることは、近似的に添付図の2本の赤線の内側にp(x,y)を制限したときの、長方形dx×dyの部分の確率の割合を考えることになります。続く
#統計 2本の赤線の内側の確率は、近似的に
p(y) dy = (∫p(x,y)dx) dy
で、長方形dx×dyの確率は近似的に
p(x,y) dx dy
で、これらの比
p(x,y) dx dy
-------------
p(y) dy
= (p(x,y)/p(y)) dy
が条件付き確率を与えており、dyを除いた
p(x,y)/p(y)
が条件付き確率密度を与える。
以下のリンク先の添付画像の説明を、連続分布p(x,y)の場合に素直に拡張したのが、添付画像の説明になっています。
添付画像の場合を理解していれば、通常のベイズ統計の勉強で困ることはない。
(渡辺澄夫『ベイズ統計の理論と方法』を読むときにも困らない。Radon-Nikodymの定理にこだわる必要なし)
総和が1の確率の2×2の分割表(c×rの分割表でもよい)で条件付き確率について理解しておけば、その連続版を考えることによって連続分布p(x,y)の条件付き確率分布
p(x|y)=p(x,y)/∫p(x,y)dx
p(y|x)=p(x,y)/∫p(x,y)dy
が得られるわけです。
xへのyの回帰の話は条件付き確率分布 p(y|x) を考えることに一般化されるので、p(y|x) についての直観的な理解は回帰分析の直観的な理解に繋がっています。
条件付き確率分布の概念は何通りもの意味で極めて基本的です。しかし、比較的易しい方の概念なので直観的に理解可能な概念になっています。
#統計
添付画像
①サンプル
②最小二乗法
③メッシュで区切る
④ (格子長方形dx×dy内の点の個数) / (その長方形を含む縦の帯の内側の点の個数) をヒートマップで視覚化。条件付き確率分布と回帰の関係。
自分が使えるプログラミング言語でこれを再現するとよい。
github.com/genkuroki/publ
繰り返しになるが、1つツイートの内容は、以下のリンク先の話の直接的な一般化になっている。
以下のリンク先の話はあまりにも簡単過ぎて、回帰の話と関係があるかどうか分かりにくいが、実際にはもろに関係がある。
高校で習う以下のリンク先の易しい数学の話を理解しておく価値は非常に高い。
数学について教えるときには、易しい話の方が先に進んだときの重要性が高いせいで、どう説明したらよいのか悩むことが多い。
簡単なことの積み重ねによって、積み重ねて来てない人にとっては難解に感じられることを直観的に透明な手続きで遂行できるようになる。
これこそが地道な勉強の醍醐味。
関連スレッドへのリンク
主旨の要約:動画に限らず、インターネット上で見つかる数学の解説を評価するときには、
*良くないもしくは不十分な 昔からよくある解説のコピー&ペーストになっていないか?
* 良くない点や不十分な点をどのように補ったらよいか?
についてもよく考えてみるべき。続く
引用ツイート
黒木玄 Gen Kuroki
@genkuroki
#数楽 YouTubeの数学解説動画を褒めるときには、
それってよく見る方法のコピペだよね
と見抜いて、
その少し先にもっと面白くて価値が高い話がある
ことを認識しておくべきだと思います。
悪化が良貨を駆逐する
ことがないように気を付けるべき。
twitter.com/genkuroki/stat
このスレッドを表示
補足:解説に良くない点や不十分な点はあってもよい。これ重要!読者の側がそういう点については自分で補えばよい。
しかし、解説者の特別なファンになってしまうと、
* 良くない点や不十分な点があることを無視して、単に絶賛しまくること
を熱心にするようになってしまう。そういうのは有害。
ベイズの定理のような本質的に小学校5年生レベルの易しい事柄や、任意次元球面の面積のような定番の数学ネタであっても、既存の解説のコピー&ペーストで済ませると、有害な解説になったり、数学的に不十分な説明になったりしてしまう。
それへの対処にはかなりのコストと高い数学的技能が必要。
どの分野であっても、良くなかったり、不十分であったりするのに、なぜか普及しまくっている解説の仕方が沢山あって、それを訂正した独自の解説を作るには、実際に教えた経験や専門的に広い知識と高い技能が要求される。
そういう部分への社会的サポートを充実させるべきだと私は思います。
例えばそのような試みの最良の例はYouTubeにある佐藤俊哉さんによるP値に関する解説です。
youtu.be/vz9cZnB1d1c
この動画は高等教育機関で積極的に利用するべきです。
しかし、既存の解説のコピペ的教育動画は高等教育機関での利用には適さないと思う。「プロ」という言葉の意味は結構重要。
youtube.com
京都大学大学院医学研究科 聴講コース 臨床研究者のための生物統計学「仮説検定とP値の誤解」佐藤 俊哉 医学研究科教授
京都大学大学院 医学研究科社会健康医学系専攻 AMED生物統計家育成支援事業聴講コース 臨床研究者のための生物統計学https://ocw.kyoto-u.ac.jp/course/328/「仮説検定とP値の誤解」佐藤 俊哉 医学研究科 教授2017年10月19日00:00 検定とP値のさまざまな誤解 13:43...
既存の解説のコピー&ペーストは素晴らしい解説だけコピペされる分には問題ないのですが、実際には全然そうではない。
高等教育機関(要するに大学)でもこの問題が明瞭にあります。
各教員はそういう問題に対処するために自分自身の専門知識と技能を使って別の解説法を工夫して来たのですが、そういう工夫へのサポートはほぼ皆無で、昨今の情勢では「同じ科目は同じ教え方をしろ」という圧力が強くなっており、サポートではなく、邪魔する方向に流れて行っているように思えます。