開閉ボタン
ユーザーメニュー
ユーザーメニューコンテンツ

  • 2021/03/20

ウイルス検査を「ベイズ統計」で解説、なぜ闇雲なウイルス検査は誤判定が多くなる? (2/2)

とんでもない数の誤判定が出てしまうワケ

 全員が受けた場合、P検査で「陽性」と判定された人は、6+9999=10005(約1万)(人)です。実際にウイルスに感染しているのが10人なのに、P検査で「陽性」になった人は約1万人(10000人)ですから、1000倍ほどの違いがあります。

 Cウイルスに感染しているのは6人なので、求める確率は、以下のようになります。

画像

 この結果を見ると、P検査で陽性になった約1万人のうち、6人しかCウイルスに感染していないことになります。また、この結果が示すことは、ウイルスに感染していないのに、9999人は陽性と誤判定されてしまうことです。

 つまり、医学的な検査を手あたり次第に行うと、誤判定となる可能性もあるのです。

 例題にあるP検査のような検査をする場合は、「ウイルスに感染したときの症状が出た人に行う」「検査する地域を絞る」「年齢を絞る」など、適切な制限が必要になります。適切に制限することで、問題にあるような条件(たとえば感染している人の割合:罹患率)が変わり、検査の精度が上がっていきます。たとえ医学が発展しても、検査は正しい条件で正しく調べる必要があります。

 確率の式に従って、きちんと計算した結果も見ていきましょう。

画像
事象A:P検査で陽性
事象B:P検査で陰性
事象C:Cウイルスに感染している
事象D:Cウイルスに感染していない

として、%を分数で表すと、次の表になります。

画像

 例題の文からわかっているのは、

画像

です。まずは条件を数式にしていきます。

画像

画像

 この結果から、

画像

画像

と条件がそろったので、式にしていきましょう

画像

 この式の分母と分子を「×10000」すると、

画像

 どこかで見たことがないでしょうか?

 そうです。この式もまた、先ほど具体的に人数で計算した式と同じです。

まとめ
  • ・感度:正しく陽性と判定される確率
  • ・誤判定された陰性:偽陰性
  • ・特異度:正しく陰性と判定される確率
  • ・誤判定された陽性:偽陽性
  • ・罹患率が低い場合は、検査対象を絞る必要がある
本記事は『いちばんやさしいベイズ統計入門』を再構成したものです。

AI・人工知能・機械学習 ジャンルのトピックス

AI・人工知能・機械学習 ジャンルのIT導入支援情報