見出し画像

「PCR検査を阻止せよ!」——彼らは何を間違えたのか——PCR・検査抑制論の疑似科学性について

2020年初頭に発生した新型コロナウイルス感染症(COVID-19)パンデミックにおいて、世界各国はWHO(World Health Organization)やCDC(Centers for Disease Control and Prevention)の勧告に基づき、検査、隔離、接触追跡を中核とする感染制御戦略を採用した。一方、日本における初期対応は国際的な対応とは全く異なる、検査を抑制することを是とする言説が流布し、あたかもこれが世界に先んずる日本の公衆衛生対策であるかのようにSNSで喧伝された。

とりわけ注目するのは、「事前確率(医療分野では通常有病率と言われている)が低い状況ではPCR検査は無意味である」「ベイズの定理に照らせばPCR検査拡充は非合理である」「検査によって医療崩壊を引き起こす」といった言説が、専門家を名乗る論者や一部メディア、党派性をもつインフルエンサーを通じて広範に流布した問題である。これらの主張は、統計学的合理性を装いながら結果として、検査抑制を非科学的に正当化する役割を果たした。

この文章を執筆し始めた2026年1月現在、新型コロナウイルスのパンデミック発生から約6年が経過している。しかし、「検査抑制論(検査を控える・拡大すべきでないという一般論)」を支持し「検査の拡大自体が(様々な経過を経て)医療崩壊を自動的に起こす」という因果関係を明確に示すエビデンスは、現時点までに存在しない。

こうした言説の多くは、数学や医学教育における仮想例題などから単純化された確率計算を、数学(ベイズ統計)の文脈から切り離して用いたものを根拠としており、検査原理や実測データ、数学を全く無視した疑似科学的・ニセ科学的な物語(ナラティブ)であった。当時の世界的状況と比較しても、日本において特に顕著に見られた現象である。

具体的には、ベイズの定理を誤用し、「事前確率が高い検査は実施してもよい、事前確率が低い検査は実施すべきでない」という単純な二項対立に落とし込む言説が、SNSレベルから専門家や識者にまで流通した。こうしたナラティブに合致しなければ、検査拡充から検査技術自体に至るまで、広範に否定的な評価を行うことを特徴とする。

この種の言説は、SNS等において「PCR抑制論」「検査抑制論」と呼ばれている。本稿ではこれらを総称して「PCR・検査抑制論」と定義し、以下では簡便のため「検査抑制論」と表記する。

本noteは、日本における検査抑制論の形成過程を振り返り、ベイズ推定の誤用およびそれらを拡散した問題について、その間違いを明らかにすることを目的とする。

とりわけ2×2のクロス表を使い、「ベイズの定理」を権威付けとして恣意的に使用した言説は、いくつもの多層的な科学的な誤りが含まれている。そのため、誤りを指摘するには相応の文章量を要するため、このような長文noteになったことを、ご承知おきいただきたい。

なお、本noteでは人物に関して敬称を略す。

1.筆者について

私はHIV-1研究を起点としてウイルス分子生物学の分野に進み、20年以上にわたり、ウイルスおよび微生物(特に核酸・遺伝子)を対象とした研究および実務に従事してきた。
プローブ法(TaqMan法)によるリアルタイムRT-PCRについては、商用化初期である2004年から、20年以上の経験を有している。HIV-1の研究班で行った共同研究では、HIV-1のTaqMan法を用いたリアルタイムRT-PCR法を開発し、地方衛生検査所への技術提供を行った。そのリアルタイムRT-PCRのプロトコールは、国立感染症研究所のマニュアルにも収載されている。以前は大学の医学部の研究室に在籍し、HIV-1検査の外部精度管理にも関わっていた。このエピソードで、個人が特定できそうではあるが、ここでは一介のPCR技術者としてあえて匿名を使わさせていただきたい。現在も研究者として仕事をしている。

科学的解説は3節からはじめるので、そちらに興味がある方は次節は飛ばしていただいて構わない。

2.検査抑制言説の形成と拡散

2020年初頭、日本のSNS空間では、PCR検査拡充に否定的な言説が集中的に流布した。検査抑制論についてまとめたブログ等から共通して見出せた、影響力の強いアカウントのSNSでの発言やバイラルメディアのニュースを以下に示す。

鎌江伊三夫 東京大学公共政策大学院特任教授

画像
※"「検査」が元凶の一端を担ったといえる理由を完全図解"のキャプションと共に作成されていた図

上図を見てほしい。左の20人中10人が感染している(有病率50%)状態で、感度70%、特異度90%の検査をしたとする。感染している10人のうち3人が陰性(偽陰性)、感染していない10人のうち1人が陽性(偽陽性)になる。この検査で陽性となった人の中で実際に感染している人の比率(陽性的中率)は88%だ。
一方、検査を受ける人の数が多く有病率が9%と低い右の集団では、陽性的中率は41%に下がってしまった。陽性判定の半分以上が「ぬれぎぬ」を着せられたわけだ。病気の人を探したいのに当たりが半分以下では困る。ならば、検査前に有病率が高い集団になるよう絞り込まなければいけない。

https://diamond.jp/articles/-/23413

なおダイヤモンドオンラインの当該記事には、後に述べる峰宗太郎もコメントを寄せている。
鎌江伊三はダイアモンドオンライン以前、2020年2月12日に「新型コロナウイルス感染症との闘い ー 知っておくべき検査の能力と限界」というweb記事で、感度60~90%特異度80~95%程度と言う具体的な数字を、コロナ禍が始まって初めて出している。

忽那賢志 国立国際医療センター医師

画像
元キャプション※PCR検査の感度70%・特異度99.9%として1000万人(うち真の感染者4400人)を検査した場合(筆者作成)

今日から新型コロナPCR検査が保険適用に PCRの限界を知っておこう

PCR検査の感度70%・特異度99.9%として1000万人(うち真の感染者4400人)を検査した場合

この表の見方ですが、新型コロナウイルス感染症の患者さんが4400人いると仮定して、PCR検査で陽性と出るのが3080人です。残り1320人は「本当は新型コロナウイルス感染症なのに検査で陰性」と判断されます。

新型コロナウイルス感染症ではない人は999万5600人ですが、このうち998万5604人は陰性と判定されますが、9996人は「本当は新型コロナウイルス感染症ではないのに検査で陽性」と判定されます。

つまり、1320人の真の患者が見逃され、その10倍の1万人の偽陽性が生じるわけです。

https://news.yahoo.co.jp/expert/articles/d70ea7909e7c41d1b2349f0f81d618ccda1cb5d3


坂本史衣 聖路加国際病院QIセンター感染管理室マネジャー

感度とは、その検査が、陽性の人を正しく陽性と判定できる確率です。新型コロナウイルスによる感染症 (COVID-19)を引き起こすウイルスである「SARS-CoV-2」のPCR検査の感度は、30~50%や70%だという報告がありますが、いずれにしても100%ではありません。

(中略)

特異度とは陰性の人を正しく陰性と判定する確率で、検査は感度、特異度はトレードオフの関係にあります。

「陽性的中率」というのは検査が仮に陽性だった場合に、どのくらいその結果が正しいか(=本当にCOVID-19にかかっているのか)を示す確率です。

風邪のような症状を訴えても、COVID-19にかかっている可能性が現在のようにとても低い(=集団の中での有病率が低い)状況で検査をすると、COVID-19にかかっていないのに検査結果が陽性と出る人の絶対数も多くなることになります。

すると、陽性という結果が出た人の中で、本当に感染している人の割合である陽性的中率もかなり下がります。よって、本当はCOVID-19ではないのに陽性の検査結果が出てくる可能性も高くなります。

https://www.buzzfeed.com/jp/naokoiwanaga/covid-19-sakamoto

BuzzFeedの坂本のインタビュー記事は様々な論者に引用され、拡散していったため、特に注目すべきであると考えられる。また、SNS上でも同様の主張を展開していた。

画像

術前全例PCR。発症前日の感度30%(4日前は0%)、特異度99%、有病率0.01%なら10万人に検査してやっと3人の感染者を把握。偽陰性が7人と真陽性の2倍強。偽陽性1000人。偽陽性者は隔離、妊婦は帝王切開一択に。事後確率0.3%。ということを考えて決めよう。

午後0:51 · 2020年5月22日

·Twitter Web Client

https://x.com/SakamotoFumie/status/1263678775755038720

感染者20倍に増やして有病率0.2%で、10万人に検査で真陽性60人、偽陰性140人、偽陽性998人。事後確率5.7%。実際には入院4日前ごろまでに検査しないと結果が間に合わないので感度は0%に近い。これで何を保証できるのか、やっぱりよく考えて決めよう。

午後0:51 · 2020年5月22日

·Twitter Web Client

https://x.com/SakamotoFumie/status/1263678776916893696

いろいろ出て来てますね。特異度99.9%で計算すると(コンタミなどありそうなのでさすがに99.99は避けたい)偽陽性100人、事後確率2.9%。別にやれとか、やるなとか言ってないので、あまりヒートアップしないでね。院内感染対策に関するfood for thought ということで。では。

午後4:32 · 2020年5月22日

·Twitter Web Client

https://x.com/SakamotoFumie/status/1263734346793381888


室月淳Jun murotsuki@「出生前診断と選択的中絶のケア」発売

画像

仮にこのPCR検査の感度を90%,特異度を90%とします(よく知りませんが,実際はさらに低いかも).しかし検査をうける本人にとって真に重要なのは感度や特異度ではなく,検査陽性のとき実際に感染している割合(陽性的中率),または陰性のときほんとうに感染していない割合(陰性的中率)なはずです

午後1:42 · 2020年2月24日

https://x.com/junmurot/status/1231801567122051072


手を洗う救急医Taka(木下喬弘)

画像

まして検査の感度が70%、特異度が95%とか言われていますので、ものすごく間違います。 そして、現実はもっと複雑です。 実際には「現在何人が感染しているか」なんてわからないからです。 通常医師はこの「検査前の確率」を経験と論文知識を元に主観的に決めています。

午前9:37 · 2020年2月25日

https://x.com/mph_for_doctors/status/1232102364993269760


病理医ヤンデル

画像
※現在はツイートを削除済み

これからあるドラマをお送りします、舞台は「ヤンデル病」というざんねんな病気が広がっている世界です。かかるとパチンコとかワクチンなどの言葉を2倍にしてゲラゲラ笑います 「99%の確率でヤンデル病を発見できる検査」が開発されました、これを使ってヤンデル病を見つけていこうと思います。

12:31 AM · Feb 26, 2020·Twitter Web App

https://web.archive.org/web/20220715050145/https://twitter.com/Dr_yandel/status/1232463168422567937


岩田健太郎 K Iwata

画像

仮に事前確率1%の場合、感度70%特異度99%の検査で陽性だと事後確率は41.4%半分以上間違いです。陽性でも感度は関係あるのです。いいですか。疑ってない無症状の人にコロナPcRしちゃダメですよ。

午後1:07 · 2020年4月25日

https://x.com/georgebest1969/status/1253898476078813185


EARLの医学ツイート

画像

コロナPCRの検査前確率0.5%、感度70%、特異度99%で計算したら、陽性に出た人のうち本当にコロナに感染している人は4人に1人しかいません。陽性に出た妊婦のほとんどが偽陽性になりますから、これで他施設に移されたり帝王切開方針になるとすると、PCRの害の方が大きすぎませんかね?

午後2:29 · 2020年6月23日

https://x.com/EARL_med_tw/status/1275299960724963332


峰 宗太郎

画像

この記事はなかなかよいのです
「PCR検査の正確性については、まだ、国際標準のエビデンスがないが、感度70%、特異度は99%という想定値がリスク分析上妥当ではないか」 日本がコロナ2波に勝つ科学的で現実的な戦略 鎌江東大教授が説く社会的価値のある医療政策

toyokeizai.netから

午前3:24 · 2020年7月3日

https://x.com/minesoh/status/1278756372792803328

他にも同様の主張をするアカウントは多数あり、それらをまとめたブログ等もまた多数あるため、ここでは以上で割愛する。

2.1 検査抑制論の問題点

当時広く用いられた説明モデルは、以下の構造を持っていた。

1.根拠のない有病率を仮定
2.実態とかけ離れた感度・特異度を設定
3.2×2表を作成し割り算を行い、これを「ベイズの定理」と呼ぶ
4.陽性的中率の低さを誇張
5.検査抑制を正当化

これらの数値設定は、全てのケースにおいて、実測データに基づいていなかった。

すなわち、結論ありきで数値を調整した疑似モデルであった。このような手法は、科学的方法論の観点から見て極めて不適切であり、科学倫理上も重大な問題を含んでいる。

重要なのは、これらの言説が単なる個人意見ではなく、医師、大学関係者、医療関係者といった「専門的権威」を伴って発信されていた点である。

結果として、誤った情報が「専門的合意」であるかのように社会に誤認された。

3.プローブ法によるリアルタイムRT-PCRは定量測定法であり、単純な感度・特異度モデルは適用できない

プローブ法によるリアルタイムRT-PCRは、核酸量を連続値として測定する「定量測定法」であり、単純に「陽性」「陰性」の二値分類を前提とする検査とは性質を異にする。

プローブ法によるリアルタイムRT-PCRの測定値は、試料中に存在する標的RNAのコピー数(分子数)を反映する0~∞の連続量であり、この定量情報を前提条件を考えず「陽性」「陰性」という二値に変換し、感度・特異度のみで評価することは測定原理上、本質的に不適切である。

加えて、適切に設計・管理されたプローブ法リアルタイムRT-PCRにおいては、標的配列に対する特異性は極めて高く、理論的にも実務的にも、特異度は100%である。これは分子生物学ではよく知られている事実である。

検査抑制論で最も科学的に見えた言説は、感度・特異度(特に特異度)を理由として検査を抑制すべきだという結論に結び付けたものであり、検査抑制論の最大の強み(もっともらしい論理)であったが、同時に最大の弱点でもあった。したがって、この点を正確に指摘することは、検査抑制論の非科学性を示す上で最も本質的かつ効果的な論点となった。

分子生物学の中での常識が、なぜこれほど歪な言説になっていったのかは、検査抑制論者の全てが、PCRの原理を理解せずに論理展開をしていったのも理由の一つである。そのPCRの原理について次項で解説する。

3.1. PCRの技術的前提と「特異度100%」の意味

PCRは大別すると、従来法PCR(conventional PCR)と、リアルタイムPCR(定量PCR:quantitative PCR, qPCR)の2種類に分かれる。PCRとは、二本(フォワードとリバース)の短い一本鎖DNA(オリゴヌクレオチドプライマー)とDNAポリメラーゼによってDNA配列を指数関数的に増幅する、分子生物学的手法である。RNAウイルスを対象とする場合には、逆転写(Reverse Transcription: RT)によってRNAから相補DNAを合成する工程が加わり、RT-PCRと呼ばれる。リアルタイムPCRと組み合わせた場合には、リアルタイムRT-PCR(RT-qPCR)となる。

さらに、リアルタイムPCRは検出方式の違いによって、大きく2種類に分類される。

  1. インターカレーター法:増幅した二本鎖DNAに結合する蛍光色素を用いて検出する方法。

  2. プローブ法(TaqMan法):増幅するDNAの内部配列に特異的な蛍光物質とクエンチャー物質で修飾されたオリゴヌクレオチドプローブを用いて検出する方法。

インターカレーター法では2本のプライマーで増幅したDNA全てを検出するが、プローブ法では、2本のプライマーに加えて蛍光プローブを使うため、標的の核酸の増幅のみを検出できるという大きな違いがある。そして、新型コロナウイルス検査において標準的に用いられたのは、この「プローブ法によるリアルタイムRT-PCR」であり、国立感染症研究所を含む国内外の公的機関において採用され、大規模なPCR検査で用いられた方式である。

コロナ禍当初の日本では、従来法PCR、インターカレーター法リアルタイムPCR、プローブ法リアルタイムPCRといった技術的区別が、ほぼ無視されたまま議論が行われていた。結果として、従来法PCRと定量PCRの混同、インターカレーター法とプローブ法の混同、果ては迅速抗原検査(Rapid antigen testsRAT)との混同が常態化し、正確な理解に基づく議論は著しく困難な状況にあったことを付記しておく。

なぜプローブ法のリアルタイムPCRでは、原理的に特異度が100%となるほど極めて高いのかは、3種類のオリゴヌクレオチドが同時に鋳型となる標的配列と一致する必要があるからである。フォワードプライマー、リバースプライマー、蛍光プローブの3つの配列、すなわち、標的ウイルス配列が存在しない限り、増幅も発光も原理的に起こらない。

これは、単にDNAが増えるかどうかを見るインターカレーター法とは決定的に異なる点である。


画像
英語版Wikipediaの図を改変

ここまでなるべく平易な言葉を使って書いたつもりであるが、専門的な用語が多いことは否めないので、わかりやすいアニメーションとしてYouTubeのコロナウイルス検査の動画を引用する。言語選択の日本語が自動翻訳であるため、一部翻訳がおかしい部分があるがアニメーションは正しいので、英語字幕を参照しながら参考にしていただきたい。

プローブ法に用いる3種のオリゴヌクレオチドの配列が一致する確率は、次のように考えられる。例として、国立感染症研究所の病原体検出マニュアル 2019-nCoV Ver.2.9.1にあるN領域のプローブとプライーマーを以下に示す。


画像
N領域のプライーマーとプローブの塩基配列

まず基本事項として、核酸(RNA/DNA)の塩基配列は、A・T(U)・C・Gの4種類から構成されている。

新型コロナウイルスのN領域を増幅して検出する感染研のプライマーとプローブでは、新型コロナウイルス特有の配列のフォワードプライマー20塩基×リバースプライマー20塩基×プローブ20塩基を使用している。これらの配列が無作為に一致する確率を単純モデルで概算すると、1/4^60=7.52316×10^-37、パーセンテージで表すと0.00000000000000000000000000000000008%となり、天文学的数字の確率であり、現実的に無視できる水準である(この逆数が原理的な特異度である)。ヒトの体内から採取した検体に、新型コロナウイルスと同じ塩基配列が連続して存在し、それがリアルタイムRT-PCRに反応するという事は、偶然では起こり得ないことである。同時に反応産物はウイルスの配列そのものであり、必然的に新型コロナウイルスが存在している極めて強い物証でもある。

新型コロナウイルスのリアルタイムRT-PCRの反応産物を、サンガーシークエンスによってシークエンシングを行うと、目的となるウイルス配列以外は出てこない。最初期こそ交差反応を警戒していたが、そこまで確認する必要がないことはすぐに明らかになった。

実務においては、さらに多重の検証工程が存在する。まず、プライマー・プローブ設計段階で、データベースに登録されている既知の全生物の塩基配列との相同性検索(BLAST検索)を行い、交差反応の可能性を排除する。次に、実際に設計したプライマー・プローブを用いて、非感染検体との反応試験を繰り返し、実験的にも交差反応が起こらないことを確認する。この時、PCRのサイクル数(40~50サイクル程度)は、通常の検査を40~50回繰り返し行ったに等しい。加えて、陰性対照・陽性対照・抽出コントロールによって、反応系のアーティフィシャルな異常反応も常時監視されている。

このような工程を経て構築された反応系では、原理的にも実務的にも、標的ウイルス配列が存在しない限り蛍光発光は起こらず、偽陽性は生じない。

実際に筆者が測定した、1分子のウイルスの核酸(RNA)が存在した時の波形と、ウイルスのRNAが存在しない状態のリアルタイムRT-PCRの波形を以下に示す。

画像
1分子のウイルスRNAが存在した時のリアルタイムRT-PCRの波形
画像
ウイルスのRNAが存在しない時のリアルタイムRT-PCRの波形

ウイルスのRNAが存在した時としていない時の波形の違いは明らかである。ウイルスのRNAが存在する場合は、指数関数的に増幅する蛍光シグナルが観測される一方で、ウイルスのRNAが存在しない場合は、まったく蛍光が測定されない。

以上のような理由により、プローブ法リアルタイムRT-PCRにおける「特異度100%」とは、理論的設計・実証試験・運用管理を検証し、交差反応による偽陽性は原理的にも排除されているため、あえて特異度で表記するとすれば特異度100%となるのである。

ここまでの説明で、科学に100%などはありえない不確実性(測定過程におけるすべての要因を考慮した「信頼の範囲」を数値化したもの)が絶対にあるはずだ、と思った方もいるだろう。しかし特異度に関しては上記説明のように、生物種特有の連続した塩基の二重結合を利用した測定系であるため、他の生化学的な測定とは異なり、例外的に取り扱うのが通常の分子生物学の考え方である。

3.2 定量測定法の不確実性はLOD95(Limit of Ditection 95%)ないしプロビットLODで示すのが適切である

限界希釈法を用いたPCRで、DNAを一分子単位で定量できることが1992年にP J Sykesらによって発表された。核酸の数を「一つ一つ」と数えられることがわかり、定量PCRという道が切り開かれた。

そしてこの発展形として、蛍光試薬でリアルタイムに測定・モニタリングし増幅産物を定量する、リアルタイムPCRが登場することになる。

リアルタイムPCRは定量精度と反応効率を考慮して75~150塩基程度の領域を増幅するよう設計されるため、大抵のアッセイ系自身のLODは1 copyになる。つまり鋳型の核酸が一分子(1コピーと言う)あれば検出ができるというのが、最適な設計がなされた一般的なリアルタイムPCRの原理である。

リアルタイムRT-PCRの反応系に1コピーの核酸が存在するとき、95%の確率で検出できる最小量(LOD95)はポワソン分布の定義から、2.995コピーとして算出される(数式は煩雑になるので別noteで示す予定)。これが、原理的なLOD95である。

本来使われるべき指標のLODについては、2020年の8月にBecky Fungらが、新型コロナウイルスの各種プロトコールのLODを比較した文献を紹介しながら解説する。


画像
SARS-CoV-2の各分析法の検出限界

この文献では原液のウイルスサンプル(患者プール検体)をドロプレットデジタルPCR(参考ページは後述)でウイルスのコピー数を定量した後、1ml中に10~3160コピーのウイルスが存在するようにサンプルを調整し、各ウイルス検出アッセイの性能評価を行ったものである。

比較したのウイルス検出アッセイは、Roche Cobas、Abbott m2000、DiaSorin Simplexa、GenMark ePlex(以上は全自動リアルタイムRT-PCR)、Panther Fusion(全自動TMA法)、Abbott ID NOW(全自動NEAR法)と、ウイルスRNAを個別に抽出(自動核酸抽出:MP24、EZ1)した後に汎用リアルタイムPCR装置(ABI 7500、LC480)を使用し測定した、全7種である。前述の感染研のプロトコールは、シリカカラム抽出と汎用リアルタイムPCRを使った、手動抽出のリアルタイムRT-PCRである。自動核酸抽出と手動核酸抽出で使われているマテリアルは同一であり、この点での差異は小さいと考えられる。

LODの項目を見れば、その能力は一目瞭然でわかる。Exp. LODは、この実験におけるLODである。プロビットLOD(Probit LOD)は、LODの不確実性を統計的な標準的手法を使って表したものであり、95%の確率で検出できる最小量(LOD95)を実際の測定データから算出したものである。定量法の不確実性は、本来はプロビットLODを用いるべきであった。

示されているLODは、プロトコールに従った時の測定機器、測定法による感度を示しており、これが原理的な臨床感度に等しい。この原理的な臨床感度に、サンプリングの失敗率をかけたものが臨床感度である。したがって原理的感度と臨床感度は、明確に区別するべきである。

特にRoche Cobasを使用した全自動リアルタイムRT-PCRでは、ウイルスRNAを完璧に検出できており、リアルタイムRT-PCRの原理どうり数コピーのウイルスRNAを検出できているものと考えられる。この全自動リアルタイムRT-PCRを用いた場合、あえて感度で示すと感度100%となるのである。二値で表す感度にしてしまうと100%となってしまい、LODで示した時に存在した統計的な不確実性の情報が失われてしまう。

また、LODであればリアルタイムRT-PCR以外の核酸検出法に対しても、客観的で直感的な比較が可能となる。例えば、日本の病院やクリニックで導入例の多かったAbbott ID NOWは、自動拡散抽出機でRNAを調整した汎用リアルタイムPCRと同等か半分以下の能力であることが、上記の表からわかる。

プローブ法のリアルタイムRT-PCRが、鋳型の核酸が一分子あれば蛍光を発する、なければ蛍光を発しないという性質を応用したのが、先に述べたドロプレットデジタルPCRという、次世代のPCRである。ドロプレットデジタルPCRはリアルタイムRT-PCRの不確実性をあえて感度・特異度とした場合には、いずれも100%となることを証明する科学技術であり、莫大なエビデンスが蓄積されている。これを否定することは不可能である。

デジタルPCRについてはThermoFisherの日本語解説をリンクしておく。
次世代の定量技術!デジタルPCRの原理とは? - Learning at the Bench

以上のようにリアルタイムRT-PCRとその派生技術は、極めて高い精度を持つ性能があり、その精度を正しく評価するためのMIQEガイドラインというものがある。通常はMIQEガイドラインに従って、注意深くアッセイを監視している。

日本語版のMIQEガイドラインもあり、大抵の疑問はこのガイドラインで知ることがでくるので目を通しておく必要があるかと考える。

https://www.gene-quantification.de/miqe-japanese-version-2013.pdf

それと比較すると、日本における感度・特異度論争は原理を全く考慮していない、非常に粗雑な議論であった。

3.3 感度・特異度が100%になってしまうリアルタイムRT-PCRで「ベイズの定理」を使うと数学的に退化(degenerate)した状態になる

それを筆者がTwitter(現𝕏)で指摘したのが以下のツイートである。

画像

ベイズ推定で検査の尤もらしさを推定するのですがPCRは原理的には感度100%特異度100%となるchain reactionの反応系であるため推定する部分が存在しません。試しに皆が騙された例のクロス表の特異度を100%にして書いてみましょう。すると事後確率は100%となって一意に定まり推定する余地がなくなります

午前3:04 · 2020年7月11日

·Twitter Web App

指摘自体はこのツイート以前から行っていたが、広く拡散したのは上記ツイートである。当時の表現が拙い部分があることは、ご容赦願いたい。

感度はともかくとして、特異度は100%である事は科学的に間違いはないので、この当時は特異度のみを例にして指摘した。前述のように、ここが検査抑制論の最大の弱点であったからだ。そもそもの問題として定量測定に感度・特異度を用いるのは不適切であるという指摘は、当noteのように説明に相当な文字数を要するため省いていた。

改めて指摘を整理すると、特異度が100%となるようなリアルタイムRT-PCRによるウイルス定量測定では、事前確率(有病率)に関係なく結論が100%になり、実質的な意味を持たないと言うことである。

当時のツイートでは「一意に定まる」と表現したが、これは数学的には退化(degenerate)した状態と言う。

数学において退化(たいか)しているという言葉は、ある種類の対象の性質が変わり、他の(ふつうはより単純な)種類の対象になっている場合に用いられる。は退化した円周、すなわち半径が0の円周とみなすことができる。正円は退化した楕円、すなわち離心率が0の楕円とみなすことができる。
線分は接平面の上に存在する退化した放物線とみなすことができる。
線分は長さ0の辺を持つ退化した長方形とみなすこともできる。

https://ja.wikipedia.org/wiki/%E9%80%80%E5%8C%96_(%E6%95%B0%E5%AD%A6)

面が線に、線が点になる状態を数学として退化した状態と言えば、理解がしやすいかと思う。

意味を持たない計算に立脚した説明モデルはその根拠が失われており、説明モデル自体が全く意味を持たないという事である。結論として、検査抑制を推進しようとした当時の激しい議論は、科学的に全く意味がない議論をしていたのである。

以上のように検査抑制論の根本的な間違いは、定量測定を単純な陽性・陰性の二値にしてしまったために、元データに含まれている様々な情報(不確実性やプロトコールによる性質の違いなど)を切り捨ててしまい、現実とはかけ離れた説明モデルになっていたことである。

4. 実測データからリアルタイムRT-PCRの特異度が100%に近いことに気付いた人々

2020年7月頃にはニュース等で国内外の実測データが出揃いはじめ、そのデータを用いて少なくとも特異度が90%や99%や99.9%ではないことに気づき始めた人達がいた。

データから見るコロナウイルスPCR検査の特異度|臨床獣医師の立場から

実測データの陽性者を全て偽陽性と仮定して特異度を計算したブログである。タツハルがまとめたこの方法は、実測データを用いて比較的簡単な計算で仮説を検証することができ、この方法で多くの人が検査抑制論の非科学性に気付くことができた。それにより医学者以外の人達が、PCR検査拡充の妥当性に納得するきっかけとなった。ベイズの定理の誤用を逆手にとった方法であり、検査抑制論の論理的破綻点を明らかにしたと言える。

次はニュージーランドの実データを用いて特異度99%と言う仮説を、確率論的に棄却したブログである。

ニュージーランドのデータ - 豚バラ大根ノート

次はニュージーランドの実データを用いて特異度99%と言う仮説を、確率論的に棄却したブログである。butabara-daikonのブログは他にも、7月時点での岩手県や島根県の実測データを用いた検定を行っており、それを強化したのが上記ブログである。

このように分子生物学が非専門であるにもかかわらず、それらの人々の手によってデータが解析され、「専門的権威」が発していた情報の不正確さが露わにされていったのである。

リアルタイムRT-PCRの特異度を99%などと低い値とする仮説は、3.1で示した原理と同じく、実測データを用いた場合においても天文学的数字の確率でなければ成立しない事が示された。原理と実測データ両方から天文学的数字が割り出されるような場合、普通の科学者であればモデルや仮説を棄却する。

その後、標的配列が存在しないにもかかわらず、交差反応によって陽性反応が生じるという現象が実測データから否定されると、検査抑制論者は当初主張していなかった作業過程における汚染(コンタミネーション)を、後付けの知識で論じるようになっていった。

しかし実測データからは、コンタミネーションが頻発するような状況も棄却される。そもそもコンタミネーションは測定原理とは独立した管理上の問題であり、原理上の偽陽性及び特異度とは概念的に区別されているが、それを踏まえたとしても、実測データから得られたリアルタイムRT-PCRの特異度は極めて高いことが示されたのである。

この問題に関してJim F Huggettらは2020年11月に、コンタミネーションによって偽陽性の結果が発生することがあるが、バックグラウンドシグナルと見なしたり、特異度の計算に含めるべきでないと提言している。

国立感染症研究所でSARS-CoV-2の検出マニュアルを作成した、ウイルス3部の白戸憲也は、令和2年度希少感染症診断技術研修会で以下のようなスライドを作成し、アッセイ系か環境が問題であると正しく認識し記事を批判している。

画像
令和2年度 希少感染症診断技術研修会スライドより引用

https://www.niid.jihs.go.jp/images/plan/kisyo/1_shirato.pdf

以上のようにコンタミネーションを意図的にアッセイ自体の精度に巻き込むことは、アッセイの正しい理解を阻害し情報を混乱させるだけであるというのが、科学者のコンセンサスとなっている。

5. そもそも2×2のクロス表を使って割り算をする行為が「ベイズの定理」ではない

筆者は数学者ではないため、数学的な詳細については専門文献を参照されたい。本節では、筆者の理解の範囲で問題点を整理する。

そもそも、ベイズの定理とは2×2のクロス表に含まれる数値を用いて割り算を行い、条件付確率を計算する行為そのものを指すものではない。

本来は、潜在パラメータに対する事前分布を明示的に仮定し、観測データ(現実に得られた検査結果のデータ)に基づいて事後分布を更新する確率モデルを構成しない限り、それをベイズ推定(ベイズの定理を使って推定した)とみなすことはできない。

インターネット上で2×2クロス表を用いて盛んに行われていた手法の実態は、根拠のない有病率を真の値として固定した上で、現実ではない数字の単なる割り算を行い、根拠のない点推定値を得ただけの操作にすぎない。言い換えれば、条件付確率の計算を行っただけであり、それによって現実の元の確率分布を推定したわけではない。

さらに問題であったのは、検査をしてはならないという理由に飛躍させ、あたかも検査抑制に高度な科学的裏付けが存在するかのように「ベイズの定理」という言葉が使われた。これは科学を装った疑似科学・ニセ科学的手法の言説であり、方法論的に看過できないものである。

そもそもベイズ推論を適用するのであれば、観測データによって不確実性を更新していく必要がある。そのためには、多くの検査を行い、得られたデータに基づいて事後分布を更新することが不可欠である。しかし実際には、その逆に、検査を抑制する根拠として「ベイズの定理」が用いられるという倒錯した議論が展開された。

医学分野における多くの「ベイズ的」説明は、仮定されたパラメータに基づく演繹的計算と、実データに基づく統計的推論とを混同し、代数的導出を証拠に基づく推論と誤認している。

ベイズ推論は、仮説形成としてのアブダクション、モデル化としての演繹、データ更新としての帰納を統合した確率的推論体系であり、これを演繹的計算のみに還元することは、その認識論的役割を本質的に歪めるものである。

また、条件付確率とベイズの定理の混同が起きた理由は、数学教育の影響が考えられる。ベイズの定理の例題として「根拠のない数値」を使用した検査問題が使われることが多く、逆確率の方法であるベイズ確率(推論思想)とベイズの定理が一緒くたに教えられるため、「条件付確率を求める=ベイズ」という安易な結びつけが起こったからである。

実際ネット上でも、これらの数学的な矛盾点や問題点に気が付いた人も多かった。ゆえに、数学を理解している人たちからは、「ベイズの算数」と揶揄され、「あれはベイズの定理ではない」と暗に言及されていたのだが、2x2のクロス表にある根拠ない数字を使って計算して解った気になり熱狂していた人々の多くは、こうした諫言に耳を傾けることは全くなかった。そして今現在も、その間違いに気づくことはない状況になっている。

6.このようなことが二度と起こらないようにするための提言

まずは数学教育に対する提言である。

このような誤解や無理解を回避するためには、「ベイズの定理」や「ベイズ推定」の教育的例題として診断検査問題を安易に用いることは、今後慎重に再検討されるべきである。パンデミックをこれ幸いにと考え、ただの条件付確率を教える教材として、あるいは雑学として取り上げた数学教育者が多数いた。そうした安易なPCR検査を否定するような情報発信によってwebの情報は汚染され、もはや日本語で正しいPCR検査の情報を得ることは不可能に近くなってしまった。web情報を元にする生成AIでも同様である。

もし、教育的目的で検査問題を例題として扱うのであれば、「ウイルス遺伝子の定量測定のように感度・特異度に変換すると100%となる検査法ではないこと」、「すべて架空の数値に基づく仮想的設定であること」、「現実の疫学調査では完全にランダムな抽出が行われることは稀であり、実世界への直接的適用は困難であること」、さらに「実際に適用可能な事例は極めて限定的であること」と、しつこいほど前提条件として明示的に示す必要がある。

医学者に対しては、それだけで相当な文字数を要してしまうので、別の機会にnoteを作成するつもりであるが、3.3で示した筆者のツイートの前のツイートを乱文であるが以下に示す。

画像

なぜ日本の医師や医学生アカウントが感度/特異度/事前確率/事後確率、あのクロス表にコロッと騙されたのか、それはテストに出るので意味もわからず覚えたからです。ここに掘り返した初心者向けベイズ推定の教科書があるのですが章の最初のページにまさに入門問題として出てきます

午前2:56 · 2020年7月11日

·Twitter for iPhone

画像

テストに出てくるからって何をバカな?って思われましたか?ネットにある第106回医師国家試験問題のG問題を見てみましょう。まさに今話題の感度/特異度/事前確率/事後確率の問題が出てきます。医学生は見覚えあるでしょう? http://wind.ne.jp/hassii/akagi_kokutai/106/106_g.txt

午前2:58 · 2020年7月11日

·Twitter Web App

個人的に、こういったサービス問題が医師国家試験に出てくること自体が大きな問題であると考えるが、この問題の出題意図は「検査結果は有病率の影響を考慮せよ」であり、間違っても検査をしてはならないという理由に飛躍させてはならない。しかもこの問題は感度・特異度が100%となるような検査を想定していない。解法だけを丸暗記し、出題意図を理解しないような学び方を省みるべきである。

筆者がSNS上で観察した医師免許保持者の発言を観察すると、検査問題の解法のみが強調され、その出題意図が十分理解されていない可能性が考えられた。本来の出題意図を切り捨てて解法だけを学ぶためだけの学習法、つまりアンチョコが蔓延していたという事である。○○虎の巻、○○必勝法、○○プラチナマニュアルなど、正式な科学的審理を経ていない、仲間内だけで通用する学習カリキュラム、教育(医学教育)分野でたびたび問題にされる「隠れたカリキュラム問題」が、この問題の本質である(隠れたカリキュラムには良いものと悪いもの両方がある)。このアンチョコに「ベイズの定理」を紛れ込ませ権威付けを行い、検査をしてはならないという理由に飛躍させたものが存在したと考えられる。そうなると、ただの条件付確率の計算をベイズの定理と思いこんだり、検査特性を理解できなかったり、例外となるとなるような検査法が存在することを学ぶ機会を喪失してしまい、現実とは乖離した検査モデルを信じ込んでしまうことになる。

この医師免許保持者の学習問題の本質を理解し、これは算数の「みはじ・はじき」と同じで「読解」「思考」を放棄し、誤った問題解決法を身に着けたものであるとSNSで指摘する一般の人もいた。医師免許保持者の中でも、限定された「仲間内」でのみ共有された学習、隠れたカリキュラムであるため、その隠れたカリキュラムを経なかった医師免許保持者からは、その単純化された検査モデルに対し激しい指摘がなされることになった。

実際、こうした学習法によって単純化された検査モデルは、パンデミック期の公衆衛生政策と衝突する形で「検査抑制論」を正当化する言説と結びつき、社会的混乱を助長する一因となった。この種の誤用は今後のパンデミックにおいても繰り返し再生産される可能性が高く、科学的概念の誤用「疑似科学・ニセ科学」として明確に区別される必要がある。

疑似科学・ニセ科学であると気づくポイントはいくつかあった。WHOやアメリカのCDC、NIH、世界の公衆衛生機関が揃って「TEST! TEST! TEST!」と言っていたのに、なぜ真逆の事を言っていたのか、なぜ2x2のクロス表を使っているのに、PPV(Positive Predictive Value:陽性的中率)だけしか使っていなかったのか、なぜNPV(Negative Predictive Value:陰性的中率)を無視していたのか、なぜ世界は100万単位の検査を行っていて、それを問題視していなかったのか等々。決定的なのは検査抑制を支持するエビデンスがない事であろう。

そういった違和感を持った時、もしかしたら自分が間違っているのではないかという謙虚さが必要であろう。筆者自身も、もし検査抑制のやり玉に挙げられていたのが、たまたま特異度が100%となるPCRでなければ、検査抑制論に与していたかもしれない。全ての人が、そういった反省をするべきではないだろうか。

7. まとめ

PCR・検査抑制論は何を間違えていたのか

1.PCRの測定原理に対する理解の欠如。
2.定量測定法であるリアルタイムRT-PCRを、感度・特異度だけの不適切な二値検査として扱ったこと。
3. 根拠のない有病率、感度・特異度を真の値として固定したモデルを作成したこと。
4. 2x2のクロス表を使って単なる割り算をした計算(条件付確率)を、ベイズの定理であるとしたこと。
5. 陽性的中率の議論を検査をしてはならないという理由に飛躍させた。
6. 現実の疫学データを全く無視した。

以上述べてきたように、検査抑制論はエビデンスから導かれた結論ではなく、「検査をしてはならない」という循環論法(結論ありきにして)を科学語彙を用いて正当化した、疑似科学・ニセ科学と言っても過言ではない言説であった。「検査を実施すべきではない」という前提を正当化するためだけに、科学用語を用いた言説である。そのため、各ステップごとに科学的な繋がりがなく誤りが蓄積されており、指摘するのには非常に手間がかかった。まともな科学者はそもそも相手にはしたくないような、初歩的な間違いが累積したナラティブであった。しかしながらそのナラティブが、影響力の強いアカウントのSNSでの発言やバイラルメディアのニュースによって拡散し、半ば事実であるかのように定着してしまった。しかし現実は疑似科学・ニセ科学であるため、当然として現実のデータとは乖離し、その言説を裏付けるエビデンスは6年経過した現在も現れない。それが検査抑制論が疑似科学・ニセ科学の一つであった証左である。


いいなと思ったら応援しよう!

コメント

4
コメントするには、 ログイン または 会員登録 をお願いします。
A.H.のプロフィールへのリンク
A.H.

興味深く拝見しました。然るべき英文医学雑誌に投稿して論文にして頂ければと思います。なお、感度については、検体中のウイルス量が少ないと陰性になることがあるようで、Covid-19の診療をなさっておられる臨床医の中には、複数回のPCR検査で陽性になり診断確定となった例を基準(100%)とすると単回…

研究者「」のプロフィールへのリンク
研究者「」
@研究者「」 さん

感度70%とは、そのアッセイの前提条件とLOD近傍であるという情報を切り捨てたものになります。本noteでも言及いたしましたが、LODで示さないと科学的に正確な比較ができなくなります。またこのLOD近傍での検出率を、アッセイ全体の検出率に当てはめるのは、統計的にも不適切です。したがって「70%とい…

「PCR検査を阻止せよ!」——彼らは何を間違えたのか——PCR・検査抑制論の疑似科学性について|研究者「」
word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1