PCR検査をめぐる「5つの理論」を検討する
【はじめに】公衆衛生の専門家として
新型コロナ問題は極めて「公衆衛生的」問題である。未曽有の経験だけに、数カ月前には誰も想像もしなかったことが現実となり、恐ろしいことに、その現実にも適応しつつあるような気すらする。今回原稿依頼を受けて、「公衆衛生の専門家のひとり」として、思うことを書いていくこととする。
新入生対象に「科学リテラシー」のコマを担当しているが、そんな感じで科学やものの考え方の筋道について、今回のコロナ禍での実話を題材に話を進めたい。原稿は、緊急事態宣言が39県で解除された5月15日のものである。
私は大学院医学研究科の「公衆衛生学分野」の教授なので、他の人が私のことを「公衆衛生の専門家」と思うのは当然なのだが、私の専門は「非感染性、慢性疾患の疫学」、「疫学方法論」あたりで、公衆衛生学全体から見れば、非常に範囲の狭いところである。
事実、2月中頃だったか、民放の某局から、朝の情報番組の出演依頼があったが、「感染症のことは全く分からないから」という理由で断った。断ったのは今でも正解と思っているが、私に声がかかるくらいだから、メディアも誰にコメントを求めたらいいのか分からない状態なのだと思う。私は「感染症が分からない」と断ったのだが、「公衆衛生の専門家」を自称しながらも、「疫学が分からない」人が次々に現れて、理論の破綻したことを言っている。しかも、それが全く問題にならないという状況が続いていて頭が痛い。今回は、私がどうして頭が痛いのか、その理由を少しでも分かち合いたく、長い話を始めようと思う。
Shutterstock.com
【①カルピス理論】何でどのくらいの濃さで割るのかで変わる味わい
5月9日放送のTBS「Nキャス」で、東京大学大学院薬学系研究科の池谷裕二教授から「PCR検査が足りないのはむしろ欧米」という話が出て、「ようやく!」と膝を打った。今までここまではっきりとそう言った人はいなかったと思うし、むしろ「日本で患者数が少ないのは検査が少ないからではないか」、「日本ではPCR検査が国際的には最低水準」という話ばかり聞かされてきた。このように、「PCR検査が足りない」と言われている評価尺度は、日本のPCR検査数、または人口あたりの検査数(検査率)である。
例えば、ある年にインフルエンザが流行って、400人の学年で200人が検査を受けた。その前の年、同じ400人で検査を受けたのは40人だったとする。流行年に比べ前年の検査数は(当然検査率も)5分の1であるが、これをもって「前年は検査数をもっと増やすべきだった」とか「検査が少ないからインフルエンザが隠れているのではないか」とか言うだろうか。いま言われているのはそういうことなのだ。
図1は人口が同じ二国のPCR検査状況を模式的に示したものである。赤い〇は検査陽性(感染)者、白い〇は検査陰性者を示す。A国ではPCR検査はB国の5倍行われている。この5倍という数字は、大きい四角の中の丸の濃度(あるいは密度)で示される。この状況で検査をしたら、A国では60人、B国では3人の陽性者が出た。感染者ベースで見れば、新型コロナはA国でB国の20倍流行している(60÷3=20)。
図1 二国のPCR検査状況の模式図
さてこのとき、陽性者ひとりを見つけるためにどれだけの検査を行ったのかという観点で検査数を比較してみる。B国では30の検査で3人の感染者を見つけたのだから、ひとりの陽性者を見つけるために30÷3=10倍のPCR検査したことになる。A国ではそれは150÷60=2.5倍である。これは同じ数の感染者を見つけるために、B国ではA国の4倍(10÷2.5=4)の密度で手厚く検査を施行していることに他ならない。
また、その差(10-2.5=7.5人)は陽性者ひとりに対して、「B国なら検査してもらえたが、A国だと検査してもらえなかった人数」である。日本でも「検査を受けたかったのに受けられなかった人」はいたのは事実だが、流行している欧米では「受けたいのに受けられなかった人が日本の何倍もいた」ということをこの指標は示している。なお、陽性者あたりの検査数は検査陽性率の逆数であり、すでに述べた池谷教授の話と一致する。陽性率は「検査の相対的不足」を示していることは記憶にとどめておいてもらいたい(後からまた出てくる)。
図2に、様々な分母設定による検査数を示した。赤線は5月8日放送のテレビ朝日「羽鳥慎一モーニングショー」で示された人口10万人対の検査数、棒グラフはそれぞれ「感染者あたり」と「死亡者あたり」の検査数を示す。感染者・死亡者数は放送当日の最新公開データを使用した。ただし、縦軸が「対数」になっているので、注意して見てほしい。なお、流行の指標として新型コロナによる死亡者あたりの値(オレンジ色の棒グラフ)*も併記したのは、未発見感染者の影響を小さくできると考えたからである。*=5月17日追記更新
感染者・死亡者あたりいずれの検査数も、日本は韓国には及ばないものの、「検査大国」と認識されているドイツより多く、イギリス、フランスは日本に遠く及ばない。このあたりの結果が、5月10日放送「NHKスペシャル」における進藤奈邦子WHOシニアアドバイザーの「日本の戦略的検査は高く評価しています」の発言につながると考える。「日本のPCR検査不足」は表面的な印象に過ぎず、不足をきちんとした理論で示したものはないように思う。
図2 PCR検査の実施回数(対数軸)
付け加えて、ここで韓国の検査数について考察する。流行状況から考えると韓国の検査数は突出している。PCR検査の充足はよい面ばかりが報道されているが、それは特異度100%を前提とした話で、特異度(注)が高いと言っても100%はあり得ない。つまり、韓国の感染者の中には、一定数の「偽陽性」が混入している。流行が一段落した今、実際隔離した「陽性者」のなかにどの程度の「非感染者(=偽陽性者)」がいたかの評価を、検査をたくさん行った国の責任として報告してもらいたい。
(注)=PCR検査における「感度」と「特異度」について 感度と特異度は、検査精度を規定する2つの指標で、感度は、感染者がPCR検査陽性を示す確率で、現在30-70%と言われている。感度が70%ということは、30%の感染者はPCR検査が陰性で、見逃される。一方特異度は、非感染者が陰性を示す確率で、PCR検査では一般に高いとされているが、100%ではない。非常に多くの検査をあまり流行していないときに行うと、特異度が高くても偽陽性者の割合が上がることが知られている。
【②アイスクリーム理論】それ、因果関係ではありません
4月27日、千葉大学大学院薬学研究院および医学研究院の研究グループからの「十分なPCR検査の実施国では新型コロナの死亡率が低い」という内容の研究がテレビで放送された。「死亡者数を増加させないために陽性率を低下させるようにPCR検査能力を拡大することが急務」と結論付けており、その番組でも賛同するコメントが寄せられ、反論は出なかった。
この結果に対して、疫学の立場から懸念を持っている。この研究は高度な方法で「関連」を見つけ出してはいるが、関連を「因果関係」とする手続きがとられていない。疫学では、関連が認められた時、それを因果関係か否かを判定する検討を行う。例えば、因果関係がなくても同じ関連が出るようなシナリオが書ける場合には、因果関係は基本的には否定される。
今回の関連に対しては、「新型コロナが流行している地域」であれば、PCR検査不足の結果として「検査陽性率は高く」なり、また同じく流行の結果として「新型コロナによる死亡率が高く」なるという考えが成立する。この「流行地域」という共通の原因から生じた2つの結果が関連を持つのは当然とする立場である。
例をあげるなら図3に示したように「アイスクリームが売れると水難事故が増える」という関連があったとする。これは「気温上昇」という原因から「アイスクリームが売れる」、「みんなが泳ぎに行き、水難事故が増える」という2つの結果が生じ、それが関連を持ったという例である。当然のことながら、アイスクリーム販売を禁止しても水難事故は減らない。それと同じ考えで、「PCR検査を増やしても死亡者は減らない」という考え方は成立する。少なくとも因果関係があると主張するなら、このシナリオを超える「死亡者を減らすパスウェイ」について提示をしなければならないと私は考える。
図3 因果によらない関連
全国の医学部では「関連と因果関係は異なる」ということを教えている。今回の例がどのような意味を持つのか、両論を掲げることなく報道したメディアはこのことに関してどのように考えるのかを問いたい。
【③寿司屋理論】値段が10倍だと満足度も10倍?
5月6日、小田垣孝九州大学名誉教授(社会物理学)から『PCR検査を倍にすれば、接触「5割減」でも収束可能?』という内容の研究が報道された。そこには「接触機会を減らす対策はひとえに市民生活と経済を犠牲にする一方、検査と隔離のしくみの構築は政府の責任。その努力をせずに8割削減ばかりを強調するなら、それは国の責任放棄に等しい」とあり、識者のコメントは見当たらなかった。また、テレビ放送でも見たが、特に反論はないようであった。
これは「社会物理学」の論文なので、疫学が専門の私は内容の詳細については理解できていない。しかし、モデルには前提が必要で、前提が間違いだったり、現実的でなかったりしたときは、出てくる結果も間違いであり、現実的でないことは、社会物理も疫学も同じと考える。私の理解で、この論文の枠組みについて説明すると、流行状態を、人々の接触、隔離、治癒の関数と置き、期間に分けて関数を作成し、接触、隔離、治癒の値を変化させたときに、流行状態がどう変化するかというシミュレーションのようである。
さて、ここで「モデルの前提」の話である。
「それぞれの対策の効果を比較するために、行動自粛率をxとし、PCR検査数を増やして隔離率をy倍増加させる対策を取ったときにどのように感染者が減少するかを比較」するとあるので、仮定したことを明示的にしてモデルを再度記述すると、「PCR検査数を(y倍に)増やして(陽性者をy倍にして)隔離率をy倍増加させる」という段階を踏んだ比例関係を前提としているように思う。少なくとも私はそう読んだ。しかしこれは検査の実際を反映していない。
図4に「枠」ごとの検査前確率の分布と検査の優先順位の模式図を示す。〇は個人を表す。上に位置するほど、感染が疑われることを示し、検査の優先順位は高い。濃厚接触者で構成される「クラスター枠」では検査前確率が非常に高く、一般人で構成される「市中枠」では低い。医師の判断による「医師必要枠」は、様々な要因で確率は広く分布すると考えられるが、原理的、道義的理由で「検査前確率が高い順」に優先順位がつけられ、PCR検査が行われているものと考える。
図4 PCR検査の枠と優先順位
日本は「クラスターつぶし」の国であるから、濃厚接触者で構成される「クラスター枠」はほぼ全例検査しているであろう。接触のない「医者必要枠」は濃厚接触者より陽性率は低いし、検査前確率が高い順に検査をしているはずだ。したがってPCR検査を増やすほど「クラスター枠」からの検査割合は減少し、増えるのは「医師必要枠」のなかでもさほど検査前確率の高くない層(図の破線で囲ったところ)である。この枠組みでは、検査を2倍にすれば、2倍の陽性者が見つかり、隔離効率が2倍に上がるということにはならない。図4からもわかる通り、検査を増やしたことにより新たに検査される層は事前確率が低く、陽性者は少ない。新たに市中枠にPCR検査を拡充すればこれはさらに下がる。
私は小田垣名誉教授の意見が間違っていると言っているのではない。私には「PCR検査を2倍にすると(陽性者が2倍になり)隔離効果が2倍になる」と読めるが、その理解は正しいか、ということと、もし理解が正しかったら、比例関係と考える理論的根拠を聞いてみたい。それだけである。あと、九州大学の疫学の専門家にどうしてコンサルトしなかったのかということも重ねて聞いてみたい。
【④パクチー理論】中華街で聞いたら日本人の90%はパクチー好きでした
東京新聞の1面トップ記事(4月30日付)にまでなった「感染状態を評価する」調査研究は、診断や隔離を目的としないPCR検査や抗体検査を、一定規模以上の集団に施行することで行われた。
私の把握している限りで時系列に書くと、①慶應義塾大学病院の入院、手術例のPCR検査によるユニバーサルスクリーニング(医療者の安全を第一目的とした患者の感染調査)、②ナビタスクリニックの希望者抗体検査、③神戸市立医療センター中央市民病院の外来受診者1,000人の保存血による抗体検査、④山梨大学医学部付属病院の全入院患者と入院予定の患者370人のPCR検査によるユニバーサルスクリーニングの4つが挙げられる(表1)。
表1 新型コロナ感染状態の調査
陽性者の出た調査①~③について、研究者は揃って「PCR検査で公式に発表されているよりはるかに高率である」とし、市中感染率を表している可能性について言及している。
ここに潜むのは「代表性」の問題である。「代表性がある」とは、サンプルの割合や平均値が、母集団と同じと考えられるということで、健康事象の分布を記述する「記述疫学」の妥当性の源である。今回の調査は、市中感染率を知りたいためのサンプル調査と考えられるので、これらのサンプルが市中感染をあらわす母集団、すなわち、当該市民を代表しているかどうかという問題である。言い方を変えれば、サンプルが母集団を代表していなければ、結果は市中感染率とは言えないということである。
例えば、①の慶應大学病院の結果について、東京新聞は、「67人は都民からの無作為抽出ではなく、この結果をもって都民の10%程度が感染者ということにはならない。また数も少なく、偶然の影響も排除できない(鈴木貞夫名市大教授)」と「にわかに信じ難い衝撃的な数字だが、米国では発熱した人の検査で5%が陽性という報告があるので、海外よりも深刻だ(上昌広医療ガバナンス研究所理事長)」のコメントを掲載している。
鈴木教授(私である)は、ユニバーサルスクリーニング目的の調査が市中感染を表しているとは言えないという立場であり、上理事長はこの値が市中感染率を代表していることを前提にコメントしている。教科書的には、代表性が担保されていない以上、解釈には注意が必要で、結果はあくまでも「目安」に過ぎない。③の神戸市民病院についても感染者が多くいる可能性があるという結論であるが、「調査の対象が外来患者に限られることや検査の正確性に一定の課題がある」という記載もあり、バランスはそれなりに取れた記載と言える。
問題は②のナビタスクリニックの報道で、東京新聞の1面トップ記事として大きく掲載され、記者による「解説」が付されていた。特に井上靖史記者による記名解説は、すでに報道された慶應大学病院の結果も近い値を示したことを引用し、「国内で感染が確認された人数を何十倍も上回る人がすでに感染した可能性を示している」と報じ、「これまで検査数を絞ってきた世界でも珍しい日本式のやり方は見直しを迫られている。いったん決めた政策に固執せず、転換を図るべきだ」と結論付けている。
代表性の担保なしで、このような断言は間違いであることは明白で、報道と同時に抗議の電話、メールが殺到し(私も出した)、東京新聞は、杉谷剛・社会部長名義で「『誤解を与える』批判について」とのコメントを出さざるを得なくなった(5月12日)。内容は以下のとおりである:検査を希望した人たちは、無作為に抽出した検査と比べてもともと偏りがあり、広く一般の人たちを代表しているとは言えません。「記事は、一般の人たちの5.9%が感染したことがあるとの誤解を与える危険性がある」というご批判を重く受け止めます。
ここまで、サンプルが母集団を代表しているかという意味での「代表性」について述べたが、代表性はもうひとつあり、それは「このような研究が、その結果にかかわらず、同じように出版、報道されるか」という意味での代表性であり、疫学ではこれに関する誤差を「出版バイアス」と呼んでいる。
今回、ひとつ問題になるのは④の山梨大学病院のケースである。これは、①と同じく、ユニバーサルスクリーニングを目的とした調査であるが、全例が陰性であった。ここでの島田真路学長のコメントはユニバーサルスクリーニングの結果に関するものだけで、この0%が市中感染率を示すなどのコメントは一切していない。また、この記事にも、市中感染率に関する記載はなかった。報道は、高い陽性率を期待しており、その時には「市中感染率」を代表しているという可能性について報道するが、今回のように陽性率0%のときには、そういう伝え方をしない。一種の出版バイアスと考える。
より深刻なのが、①の慶應大学病院の事例である。大学病院のホームページに、ユニバーサルスクリーニングの結果が掲載されているのだが、新聞記事のデータとなった4月13日から19日のもの、5/67 (7.46%、その後陽性が判明した患者が1人あった)の前に、4月6日から12日の結果、0/97(0%) とある。報道された時点で、すでに結果の出ている前の週のもの(全員陰性)を報じずに、当該週の6.0%だけを報じるのは、バイアスという言葉で片づけるにはあまりに悪質と考える。これは、説明が必要な事例と個人的には考えている。
【⑤下茹で理論】下茹でだけで食べたほうがいいんじゃないの
ここ数日「抗原検査」が話題になっている。不足が叫ばれるPCR検査の前段階に使おうということらしい。報道情報を参考に、PCR検査のみの従来法と抗体検査を導入した新法の流れ図を描くと図5のようになる。検体はPCR検査と同様であるため、診断能力が「検体の質」に依存することも同じであり、実質的な低感度の原因となっている。PCR検査の感度を50%とすると、抗原検査の感度は40%程度と考えるのが妥当であろう。
図5 抗原検査の流れ図
いい意味も悪い意味も込めて「抗原検査はPCR検査の簡易バージョン」だと思う。よいことは測定そのものが早くできること、悪いことは感度が低いことである。通常、スクリーニングはとにかく「感度の高いもの」を使うのが原則なので、「王道」の使い方はできない。抗原検査の使い方は、注意が必要である。
新法は、抗原検査とPCR検査が二段構えになっている。図5に示した通り、抗原検査で「陰性」だった症例にPCR検査を実施して診断を付けるということである。これは通常のスクリーニングで「陽性」だったものに高次検査を実施するというものとは異なる流れであり、あまり効率的とは思えない。問題なのは陽性率が高くないときで、例えば100人の集団で感染者は10人いたとき、感度40%なら感染者は10人中4人しか見つけられないので、結局PCR検査を96人に実施することになる。結局は100例につき4例節約ができるだけで、抗原検査をやった意味があまりない。
いっそのこと、感度50%(PCR検査)も40%(抗原検査)も変わらない、と割り切って、完全にPCR検査の代替とする方法も一考の価値はあるように思う。私はこちらの割り切った考えの方がむしろしっくりくる。というのは、もともと感度が50%の検査だったので、それが40%に落ちたところであまり変わらないと思う(50%に目をつぶっていた人が40%で目くじらを立てるのはおかしいということ)からである。
この話で欠けているのは「特異度」の扱いである。欠けているということは「不問にしている」ということで、特異度100%が前提の、偽陽性のない話が進行しているという意識は持っていなくてはならない。時々出てくる「無意識の前提」とはこういうことを言っている。抗原検査の特異度についてはきちんとした検証が必要である。これが低いようなら、抗原検査にはご退場願わなければならない。
抗原・PCR検査は現在の感染を見るもので、新型コロナの治療法がない(あるのは対症療法)こともあり、この検査の主目的は「隔離」である。そしてその問題点は「感度が低いから隔離が十分にできない」ということである。それを「検査の数」で補うことはできない。何度も繰り返すが、抗原・PCR検査は感度が低く、そういう検査に頼った戦略は危うい。個々の事例はともかくとして、総論としては、治療は原因ではなく症状に応じてするものと考える。
【終わりに】最初の流行に対する成功を評価し、次の流行に備えよ
ここまで、疫学的視点から新型コロナ問題について論じてきた。ここで使用したデータは、公開されているものだけであり、用いた手法は、加減乗除のみである。ものごとを印象で片づけるのではなく、きちんと筋道を立てて考えることの重要性に気付いてもらえれば幸いである。きちんと筋道を立てた思考こそが疫学者のプロ意識だと考えている。
まだまだ書きたいことはある(アビガンのこととか、特定の1例の過熱報道のこととか)が、紙面が尽きた。とりあえずは、日本の最初の流行に対する成功を評価し、次の流行に備えられるよう、油断なく準備をする必要がある。最後に3月中旬に考えた私版「新型コロナに対する方針」を提示する。今でもこの考えは変わっていない。
① 患者数把握ではなく死亡者数最小化
② 病院は隔離ではなく治療を
③ 治療は原因ではなく症状に応じて
④ 検査は希望ではなく必要に応じて