統計学の用語には,日常用語に似た語もあるためか,頻繁に誤用される語がある。以下の Yahoo! 知恵ノートに書いた「母数」などは,その最たるもので,朝日新聞の統計記事でも誤用されてる。
この母数と並んで頻繁に誤用される統計用語が,サンプル数である。
サンプルサイズ(sample size,標本サイズ,標本の大きさ)ことを誤ってサンプル数(the number of samples, 標本数)と呼ぶ人が非常に多い。。
例えば, 30 人と 40 人の身長の母平均の差を検定するのに,
サンプル数は 2
サンプルサイズは 30 と 40
である。
日常用語で群数と呼ばれるのがサンプル数(標本数)であり,したがって,この問題は,2群問題であり,2標本問題なのである。だから,「サンプル (標本)= 群」と覚えておけば,まず間違わないだろうが,実際には,大学教員でさえ誤用している例が見受けられる。その誤用の多くが,個々の測定値(観測値)をサンプル(標本)だと思っているのである。
例えば,関西大学の間淵領吾氏が奈良大学で行なった講義「調査結果を吟味する」は,その誤りの典型例である。
一方で,正しく注意を促す教員もいる。例えば,富山大学の唐渡広志氏の 統計学講義 第3回 母集団と標本 p.5 の解説のように,n を「標本数とはよばない!」と,!を付けてまで指摘している。あるいは,神戸大学の羽森茂之氏も, 「標本の大きさ(サンプルサイズ:sample size)と標本数」という解説で,両者を混同しないように注意を促している。
大学の教員なら,たとえ統計学の専門家でなくても,正しい用語を学生に教えてほしいものである。
********
2016年5月8日追記
外国でも,サンプルサイズとサンプル数を混同する人が,かなり多いらしく,大学教員が注意を促している。
この内容を理解すれば,サンプルサイズとサンプル数を混同しないと思う。
特にその p. 3 に,
Many students are confused about the number of samples versus the sample size. と書かれているが,少なくとも日本では,学生どころか,大学教員でも混同する人がいるのである。ちょっと恥ずかしい。
あるいは,テキサス大学ダラス校の Metin Çakanyıldırım の解説
その p. 1 に,
The number of samples and the sample size can potentially be confusing. Sample size is the number of items within a group. Number of samples is the number of groups. 日本の大学教員も,ここをきちんと教えてほしいものだ。
|