現在位置 : 統計Web | コラム | 統計備忘録 2009年6-7月

コラム  『統計備忘録』   バックナンバー

2008年 | 2009年 1-2月3月4月5月|6-7月|9-10月11-12月 | 2010年  

第72話 「錯誤相関」

先日、バイアスについて調べ物をしていたところ、Wikipedia上で「錯誤相関」なる用語と遭遇しました。忘れないうちに備忘録にメモしておきます。

錯誤相関(英語ではillusory correlation)とは、相関があると思い込んでしまうこと、錯覚による相関です。例えば、あなたが、初めての旅行先で道に迷って途方に暮れていたところ、通りすがりの地元の人が目的地まで連れて行ってくれたとします。たまたま通りすがりの人が親切だっただけかもしれませんが、あなたは、「この土地の人はなんて親切なんだろう」と思うのではないでしょうか。このケースでは、初めての旅行先で「情報が少なく」、誰かに助けてもらいたいという「期待」があったところへ、わざわざ目的地まで連れて行ってくれるという「稀な」やさしさに出会ったのですから、錯誤相関が生じる条件を十分に満たしています。

芸能人が不祥事を起こしたときに「やっぱりね」なんて思うのも、ジンクスを信じるのも、錯誤相関によることが多いと思います。

データ分析をしていて、僅かな違いに意味を見出すのも、違いがあるのに無視してしまうのも錯誤相関のなせる業かもしれません。



2009.6.18



第73話 「バイアスとの付き合い方」

以前のコラムで、誤差には系統誤差と確率誤差の2種類があると書きましたが、バイアスはこのうちの系統誤差に含まれます。

バイアスとは、データ収集の方法によってデータが真の分布から一定の方向へずれてしまう(系統的なずれがある)ことを指します。人間を対象にした実験や調査では頻繁に起こることなので、医学、社会学、心理学などではバイアス自体が研究テーマになるほどです。名前の付いているバイアスは山ほどあって、ざっと思いつくだけでも、自己選択バイアス、健康労働者効果、診断バイアス、想起バイアス、調査員バイアス、Berksonバイアス、Neymanバイアス、マッチング・バイアス、確証バイアス、代表性バイアス、出版バイアスときりがありません。前回のコラムで取り上げた錯誤相関もバイアスの1種になります。

バイアスがコントロールされていないと、信頼性の低い研究と見做されます。バイアスをコントロールする主な方法は次の3つです。

 1.バイアスが入り込まないようにする
 2.バイアスの懸かり方を無作為化する
 3.バイアスを要因に組み込んでデータを分析する(局所管理

医学研究で信頼性がもっとも高いとされるRCT(Randomized Controlled Trialの略称。ランダム化比較試験、無作為化対照試験などと訳される)は 2 の無作為化を目指したものです。RCTでは実験群(新しい治療法を試す群)と対照群(旧来の治療法やプラセボを試す群)への割り付けをランダムに行います。こうすることで、医師が特定の傾向の人に協力を募ったことによるバイアスや、試験協力者の治療効果への期待や知識の違いによるバイアスなど、バイアスの出現率が実験群と対照群で理論上は等確率になります。実験群、対照群ともバイアスの影響が等しいので、両群で差が見られたなら、それは新しい治療法の効果と捉えることができます。

また、RCTを行うときには盲検法も合わせて行います。協力者に自分が実験群なのか対照群なのか分からないようにします。これは協力者の期待からくる見せかけの治療効果(プラセボ効果)を無作為化するためです。実験者の医師にもどちらの群か分からないにするとき、二重盲検法(双盲法とも。英語では double blind test )と言います。これは、協力者が医師の言動からどちらの群なのか察しがつかないようにするのと、医師の治療法への期待、思い込みによるバイアスを排除するためです。

3 の局所管理については、Mantel-Haenszel検定2元配置以上の分散分析重回帰分析多重ロジスティック回帰分析などの多変量解析を用い、バイアスとなりそうな要因を説明変数に追加してデータを分析します。例えば、飲酒と肺癌の関係を調べると関連があるように見えますが、これは飲酒する人に喫煙する人が多いためで、実際には飲酒と肺癌の間に因果関係は見つかっていません。このような時は喫煙の有無で分けてから、飲酒の有無と肺癌発症の有無をクロス集計をしてみると両者に関連が無いのが分かります。検定で確かめたいなら Mantel-Haenszel検定を使います。喫煙のように原因系(飲酒)と結果系(肺癌の発症)の両方と相関があるような因子を交絡因子と言って、交絡因子によって結果が歪んでしまうことを交絡バイアスがあると言います。


 

さて、次回は代表的なバイアスを幾つか取り上げてみたいと思います。



2009.6.25



第74話 「選択バイアス selection bias」

選択バイアスは、 実験や調査の対象となった集団が、母集団を正しく代表できていないときに起こる偏りです。次のようなバイアスが選択バイアスに分類されます。



自己選択バイアス self-selection bias
臨床試験などで参加者を募集すると、健康に自身のある人が集まってきたり、疾患に関心の高い人が集まったりと、参加者の意志が入り込むことによって起こるバイアス。志願者バイアス volunteer bias とも。



未回答者バイアス non-respondent bias
調査に回答してくれる人と回答してくれない人の間で違いがあること。未受診者バイアスとも。例としては、胃ガン検診受診者よりも未受診者の方が胃ガンによる死亡率が高いなどがある。



 

健康労働者効果 healthy worker effect
特定の職業や職場環境によるリスクなどを測ろうとして、事業所に勤務している労働者を対象にして調査すると、病気によってすでに退職した人、休業している人が含まれないため、一般人よりも健康という結果が出てしまうこと。



Berksonバイアス Berkson's bias
病院の患者などを調査対象とした場合、一般の人よりも有病率が高かったり、病院の専門性などにより特性に偏りがあったりすること。入院率バイアス admission rate bias とも。



Neymanバイアス Neyman's bias
症例対照研究の多くは病院への来院者から患者群と対照群を選ぶ為、進行が早く来院前に死亡することがある疾患や、来院しなくとも治癒してしまうような疾患では正しい比較ができないこと。罹患者−有病者バイアス prevalence-incidence bias とも。



脱落バイアス losses to follow up
長期にわたる追跡調査などでは、死亡、転居、同意撤回などにより、必ず脱落が発生する。脱落の理由が調査の目的や方法と関連がある場合、結果が歪む原因となる。


 

診断バイアス、発見兆候バイアスなどこのほかにもあります。選択バイアスの事例は医学統計に多く見られますが、病院を学校と読み替えてみれば、教育調査にもあてはまるものが多いと思います。



2009.7.2



すべてのコラム タイトル一覧  タイトル一覧(カテゴリー別)

第75話 「情報バイアス information bias」

選択バイアスは研究対象の選び方に起因するものでしたが、正しく対象を選ぶことができても、測定の仕方に問題があり正しい情報が得られないことがあります。



想起バイアス recall bias
過去に起こったことを質問すると、人によって、思い出した内容の正確さや完全さが異なることにより起きます。 例えば、難病の子供を抱えた母親は、そうでない母親よりも、子供が幼いときのことを鮮明に憶えています。



思案バイアス rumination bias
回答者が質問の内容に思いを巡らして、大げさに回答したり、都合の良いように回答したりということがあります。よく似たバイアスにホーソン効果 Hawthorne effect があります。ホーソン効果とは実験に参加している人は、実験に参加しているという意識によって普段以上にパフォーマンスが上がるという現象です。



質問者バイアス interviewer bias
聞き取り調査のとき、質問者が先入観を持っていると、回答を誘導してしまったり、先入観にあてはまるように回答を解釈してしまったりすることがままあります。



測定バイアス measurement bias
測定装置に問題があったり、測定する人によって違いがあったりすることによるバイアスです。質問者バイアスも測定バイアスの1つと言えます。



家族情報バイアス family information bias
特定の疾病について調査する場合、罹患者の方が症状について詳しい為、家族の病気にも気付きやすく、罹患者の家族の罹患率が実態よりも高めになってしまう傾向があります。



社会的望ましさによるバイアス social desirability bias
アンケートでよくあることですが、無意識のうちに、あるいは、意識的に、回答者が自分を良く見せ掛けるような回答をしてしまいます。例えば、「拾ったお金は警察に届けますか」、「老人に席を譲りますか」というような質問をすると、実態よりも「はい」と答える人が多くなります。人によって社会的望ましさに対する反応の程度か異なるためバイアスを生じます。社会的容認バイアス、社会願望バイアスとも訳されます。


 

このほかにも、誤分類バイアス Misclassification bias、診断バイアス Diagnostic bias などがあります。



2009.7.22


 

様々なバイアスを紹介した論文
Sackett,D,L: Bias in analytic research. Journal of Chronic Disease,32,51-63, 1979



追記 2010.8.19



次のコラムへ 最新のコラムへ

タイトル一覧へ  タイトル一覧(カテゴリー別)へ

統計WEB

主催:社会情報サービス統計調査研究室

Google
ウェブ検索
サイト内検索