#統計 統計学における「母数」はparameterの訳語です。
日本語化する前のparameterの概念自体が混乱しているように見えるので、その混乱を訂正することなく、母数警察をやっても統計学教育として有害なだけだと思います。続く
-
-
Show this thread
-
#統計 奥村さんは国語辞典から ①推計学で,母集団の特性を表す値。 ~ ③媒介変数のこと。助変数。パラメーター。 を引用し、「母数(parameter)とは分母のことではありません」と言っています。しかし、その引用の内容は、多くの統計学入門書の説明の悪影響をもろに被ったものになっている。続くShow this thread -
#統計 所謂パラメトリック統計の最尤法では、パラメーター(媒介変数、助変数)wを含む確率分布p(x|w)を数学的モデルとして与えて、母集団からの無作為抽出で得たサンプルを用いてパラメーターwの値を決め、母集団分布を近似していると期待できる確率分布を得ようとします。続くShow this thread -
#統計 続き。当たり前のことですが、設定したパラメーター付きの数学的モデルp(x|w)の範囲内で母集団分布をぴったり記述できる保証はありません。 だから、数学的モデルと現実の母集団分布を混同することや、混同させたり、混同を放置することは、極めて非科学的な行為です。続くShow this thread -
#統計 ところが、多くの統計学入門書の説明は、その意味で極めて非科学的なスタイルになっているように見えるんですね。例えば、東京大学教養学部統計学教室編『統計学入門』の説明のスタイルには問題があると思う。数学的モデルが現実の母集団にぴったり一致しないことを当然としていない。Show this thread -
#統計学 東京大学教養学部統計学教室編『統計学入門』の説明にスタイルに対する私の批判については、私のツイログ https://twilog.org/genkuroki/search?word=%E6%9D%B1%E4%BA%AC%E5%A4%A7%E5%AD%A6%20%E7%B5%B1%E8%A8%88%E5%AD%A6%E5%85%A5%E9%96%80%20pic&ao=a … および以下のリンク先のスレッドからのリンクを参照。https://twitter.com/genkuroki/status/1164893133957550083…Show this thread -
#統計 数学的モデルに入っているパラメーターと現実の母集団分布の平均や分散などの「母集団の特性を表す値」は概念的に明瞭に区別されなければいけません。だから、母数(parameter)について ①推計学で,母集団の特性を表す値。 を含む説明を安易に引用することはミスリーディングだと思います。Show this thread -
#統計 統計学では、数学的モデルに入っているパラメーターと母集団の母集団の特性を表す値の両方を母数(parameter)と呼ぶよろしくない習慣が固定されてしまっているように見える。Show this thread -
#統計 数学的モデルと現実の母集団を明瞭に区別して、文脈ごとに「母数」の意味が全く違うことを認識できないと、統計学における基本的な考え方や概念を科学的にまともなスタイルで理解できない仕組みになっているわけです。Show this thread -
#統計 以上の批判は日本語圏に限らずに通用する批判です。 日本語圏ではparameterを「母数」と翻訳したせいでもっと悲惨なことになっている。「母数」の「母」は「母集団」や「分母」などにも登場するので、その類推で「誤解」する人が出て来るわけです。続くShow this thread -
#統計 私はdeterminantを「行列式」と翻訳したせいで、「行列」や「行列を含む式」と「行列式」の区別が曖昧になっている学生が毎年出て来てしまうことを知っています。 これは翻訳に仕方がまずかったのだと思う。 「行列式は行列ではない警察」をやっても不毛で、違う方法を採用するべきだと思う。Show this thread -
#統計 parameterを「母数」と翻訳したのもまずかったと思う。 しかもその場合には、数学的モデルに入っているパラメーターも母集団の特性を表す値もparameterと呼ぶ混乱を招き易い習慣が背景にあるので、なおさら「母数警察」は不毛だと思います。 用語の使い方はそう大事な問題ではないです。Show this thread -
#統計 母集団の特性を表す値もparameterと呼ぶ習慣は非常によろしくないのですが、今更変更するのは無理だと思う。 母集団分布を近似していると期待される分布を得るために使われる数学的モデルに入っているパラメーターと母集団の特性を表す値を厳密に区別した説明をすることが重要だと思う。Show this thread -
#統計 数学的モデルと現実を明瞭に区別することは、ベイズ 統計の主観確率による解釈(これも非常に残念なことに標準的に普及してしまっている)に陥らずに、科学的にまともで有用な道具としてベイズ 統計を理解することにもろに関係していると思う。https://twitter.com/genkuroki/status/1158993623834173440…Show this thread -
#統計 赤池弘次さんの1980年の論説や渡辺澄夫さんの講義のスライドは見る価値があります。 赤池弘次さんの1980年の論説↓ https://ismrepo.ism.ac.jp/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=32568&item_no=1&page_id=13&block_id=21 … 統計的推論のパラダイムの変遷について 赤池 弘次 https://jstage.jst.go.jp/article/butsuri1946/35/7/35_7_608/_article/-char/ja/ … エントロピーとモデルの尤度 赤池 弘次https://twitter.com/genkuroki/status/1159001461159653376…Show this thread -
#統計 統計学入門書の説明のスタイルで気になるのは、「正規母集団」の仮定の部分。 「おい、こら、母集団が正規分布していると仮定できて当然であるかのような説明すんなよ!」と言いたくなる。 教えている側は試験の採点業務なんかで正規分布から程遠い分布を見ることに慣れているはず。Show this thread -
#統計 「母集団分布が正規分布でなかったとしても、正規分布にほどほど近い分布になっていれば、正規分布モデルを用いたある種の推定の誤差は実用範囲におさまる」というような方向の説明であれば正しいと思う。ただし、推定に失敗するリスクについても触れておくべき。Show this thread -
#統計 母集団からの無作為抽出で得たサンプルの平均と分散を計算することは実質的に正規分布モデルによる最尤推定と同じです。平均や分散の計算にも現実にはぴったり一致しないと予想される数学的モデルが関わっている。 「正規母集団の仮定」というスタイルの説明は廃棄してよいと思う。Show this thread -
#統計 「現実の母集団分布が正規分布になっていると仮定する」のように受け取られる可能性のある説明は廃棄して、「現実の母集団分布は未知である」という点を強調し続けた方がよいと思う。 添付画像の図式は改良の余地が大有りだが、ポイントは数学的モデルと現実の明瞭な区別。pic.twitter.com/b54gmUiQUQShow this thread -
#統計 正規分布の確率密度函数 p(x|μ,σ²) = (1/√(2πσ²))exp(-(x-μ)²/(2σ²)) に2つのパラメーターμ,σ²が入っている、という言い方は数学的に普通です。 統計学で母集団分布の平均や分散もパラメーター(母数)と言う習慣になっていることは、ミスリーディングの原因になりまくっていると思う。Show this thread -
#統計 東京大学教養学部統計学教室編『統計学入門』の著者達は科学的な考え方や数学的な基礎付けと整合的に統計学における基本的な考え方を理解しているとは思えないのです。 この教科書を呼んだ人は非常に多いはずなのに、私のような文句を誰も言わないことの方が不思議。https://twitter.com/genkuroki/status/1209624858910318592…Show this thread -
#統計 「統計学[における母数]の定義はこちらもいまいち」のように辞書的記述に文句を付ける前に、統計学入門の教科書的記述の側に問題があることを強調しないとフェアじゃない。 統計学入門の教科書における伝統的説明スタイルはチョー算数問題に匹敵する問題だと思う。 https://twitter.com/h_okumura/status/1209631799795568640?s=21 …https://twitter.com/h_okumura/status/1209631799795568640…Show this thread -
#統計 母数警察の捜査対象は統計学入門の教科書を書いている人達であるべき。 例えば【頻度主義で母数は定数だが、ベイズ統計で母数は確率変数になる】と書く人達には「職務尋問」必須。 定数になる母数は母集団の特性を表す値で、ベイズ統計で確率変数になるのはモデルのパラメーターで意味が違う。Show this thread -
#統計 現実の母集団の特性を表す値は頻度論とかベイズ統計だとかと無関係に定数です。 パラメーター付きの確率分布を用いるベイズ統計の数学的モデル内でパラメーターを確率変数とみなすことと現実の母集団の特性を表す値はまったく別に話。 ベイズ統計入門の本の多くがこの点について論外にひどい。Show this thread -
#統計 統計学入門の教科書がひどいという状況は最近始まったことではなく、数十年以上前からずっとそうなのです。 こういう現状で、統計学入門を高校や中学校の数学の時間に教えるように制度を変えても、上手く行くとはまったく思えない。Show this thread
End of conversation
New conversation -