(写真:nist6dh/クリエイティブ・コモンズ表示 2.0 一般)
業績に基づく支払い方式=ペイ・フォー・パフォーマンス(P4P; pay-for-performance)とは、ガイドラインに則った医療行為を行ったり、患者の健康アウトカム(生存率など)を改善させた医療機関(もしくは医師個人)に対して経済的なインセンティブを与える支払い方式のことです。ここ10年くらいで急速に多くの先進国で採用されるようになってきたシステムであり、最近では途上国でも取り入れられるようになってきています。ただ問題なのは、このP4Pが本当に意図しているような結果を得られるのか、と言うことです。
P4Pはロジックとしては極めてシンプルです。我々が期待しているような結果を出すことができたらボーナスを与えると言う仕組みですので、感覚的には「効果がありそう」と感じる人が多いのではないでしょうか?ただ、その直感と実際にエビデンスがあることとは別の問題です。P4Pはよりガイドラインに則った治療行為を医療機関に行わせるといういわゆる「プロセス」の部分では効果を発揮するというエビデンスがあるのですが、その下流にある、患者の健康という「アウトカム」を改善させるかどうかと言う点になるとエビデンスはかなり否定的です。P4Pが患者のアウトカムを改善するのかということを検証した研究は複数ありますが、改善には結びつかないというエビデンスの方が圧倒的に優勢です。これほどエビデンスが弱いにもかかわらず、その耳当たりの良さから、先進国のみならず途上国までもP4Pに飛びついてしまっていることは大きな問題だと思われます。
医療の質の測り方:ストラクチャ―、プロセス、アウトカム
まず最初に医療の質の基本の話をしましょう。一般的に、医療の質は3つのレベルで評価されます。その3つとは、①ストラクチャー(構造)、②プロセス(過程)、③アウトカム(結果)の3つです。これは1980年に米国のアベディス・ドナベディアンによって提唱されたもので、今では医療の質の評価におけるスタンダードとされています。
- ストラクチャー(構造):施設基準、医療機器の充実度、医療スタッフ(専門職)の種類と人数など
- プロセス(過程):実際に行われた診療行為や看護ケア、ガイドライン遵守率など
- アウトカム(結果):生存率/死亡率、再入院率、合併症発生率、患者満足度など行われた医療行為の結果のこと
一般的に、患者や医療者が最も重要視するのはアウトカムであるとされています。自分が病気になって病院にかかったときのことを想像してみてください。自分の担当医がガイドライン通りの治療を行っているか(プロセス指標)ももちろん大事ですが、それよりも、自分が生きて帰れるか(アウトカム指標)の方が重要だと感じると思います。
アウトカム指標をP4Pで使うにあたって問題になるのは、重症な患者を数多く診るほどその医療機関のアウトカムは悪くなってしまう可能性があるということです。もちろんアウトカムを評価するときにきちんと「リスク補正」はします。そしてこのリスク補正の精度は年々改善してきており、現在では基本的に大きな問題は無いとされています。それでもなお、医療機関や医師の中では自分の成績が悪くなるのは避けたいので、重症患者を避けるということが起きてしまうかもしれません。この「客観的な測定の難しさ」もしくは「リスク補正の難しさ」が、アウトカムが最も重要であるとされながらも他の指標、特にプロセス指標を併用することが必要になる理由です。
一方で、プロセス指標の客観的評価はそれほど難しくありません。例えば、糖尿病患者のHbA1c値を定期的に測定しているかどうかといったものがプロセス指標になります。これはガイドラインで推奨されている診療行為であり、基本的には(例外的な患者を除いては)医師や医療機関は遵守するべきものです。やったかやらなかったか、だけの話ですので、患者が重症かどうかはあまり関係ありません。つまり「リスク補正」がほとんど必要ないのです。つまり、アウトカムほど重要ではないと考えれているものの、評価がより客観的でリスク補正がきちんとできているかという心配がほとんどないため、プロセス指標は医療の質評価で広く用いられています。ただし、プロセス指標にも欠点はあります。プロセス指標は診療の質の目安に過ぎず、本当に患者にとってメリットがある結果が得られているかどうか明らかではないということです。例えどんなにきちんとHbA1c値を測定していたとしても、脳梗塞や網膜症などの合併症の率が高い医療機関の”医療の質が高い”のかというとはなはだ疑問です。逆に、例えHbA1c値の測定頻度がガイドラインと違ったとしても、糖尿病の合併症の発生率がとても低い医療機関があった場合、それで良いのではないか(少なくとも患者はハッピーなのではないか)という考え方もあります(現にガイドラインよりもより進歩的な医療を提供することで患者のアウトカムを改善させている医療施設もあると思われます)。本当の「ゴール」は患者のアウトカムを向上させることであり、プロセス指標はそれを達成するための手段に過ぎないことが、プロセス指標をP4Pに使うにあたって考慮しなければいけないことになります。
ストラクチャももちろん大事なのですが、他の2つと比べると重要性および評価の信頼性の両方に関して劣るため、P4Pに関しては他の2つが使用できない場合を除いては使われることは比較的まれです。
以上のような理由より、以前はP4Pはプロセス指標を測定してボーナスを与えていたのに対して、現在ではプロセス指標とアウトカム指標を組み合わせたものが主流となっています。
各国におけるP4Pのエビデンス
日本の診療報酬制度では、看護職員1人に対する入院患者の人数で支払われる金額が変わってきます。これはストラクチャに対するP4Pであるととらえることができます。
ここからは、イギリスとアメリカにおけるP4Pの歴史と、そのインパクト評価の結果をご紹介します。
イギリスでは、2004年よりQuality and Outcome Framework(QOF)(「クォフ」と読む)と呼ばれるP4Pを導入しました。かかりつけ医(GP)において、10の慢性疾患、医療機関のケア、患者の満足度を対象に、146の審査基準が設けられ、ポイントの高い医師にはボーナスが支給されるようになりました。このQOFが医療の質の向上させたかというとエビデンスはどちらかというと否定的です。例えば、QOFの導入によって高血圧患者の血圧のコントロールが改善されたかどうか、分割時系列デザイン(ITS)を用いて解析を行った研究がありますが、高血圧のコントロールはQOF導入前から改善傾向にあり、この政策導入によるインパクトはほとんどないことが明らかになりました。(Serumanga, BMJ, 2011)
アメリカでもP4Pが導入されています。アメリカではまず、Premier Hospital Quality Incentive Demonstration Project(HQID)という実験が2003~2006年に行われました。このプロジェクトでは、任意で参加した262の病院を対象に、プロセス指標とアウトカム指標を組み合わせた34の指標を設定して、それに対して経済的なインセンティブを与えました。HQIDの導入によってプロセス指標は改善したものの、死亡率などの患者のアウトカム指標(死亡率)には長期的にはほとんど影響がなかったことが研究で証明されました。(Jha, NEJM, 2012; Ryan, HSR, 2015)
HQIDはその後、様々なところで発展を続けました。アメリカ国内では、HQIDをもとにして、メディケアの支払いを受けている全病院を対象にしたP4PであるValue-Based Purchasing Program(VBP)が導入されました(HQIDは任意参加でしたがVBPは強制参加です)。2012年10月1日以降の退院時の支払いから適用されるようになっています。VBPはプロセス指標だけでなく、患者の30日死亡率そのものもP4Pのターゲットにしています。我々のグループがデータを解析していますが、VBPが患者の死亡率を改善するというエビデンスは見つかりませんでした。(未発表データ)一方で、HQIDは2008年にAdvancing Qualityという名前でイギリスに輸入され、イギリス北西部の全24のNHSが所有する病院で導入されました。このプログラムは患者の死亡率を下げたという研究結果があります。(Sutton, NEJM, 2012)なぜアメリカのVBPが効果が無く、イギリスのAdvancing Qualityが効果があるのかという疑問は残りますが、現時点ではその理由は明らかではありません。
このような状況のことを英語では、Evidence is mixed(両サイドのエビデンスが存在していてどちらとも言えないということ)と表現します。しかし、数多くの研究結果を総合的に判断すると、P4Pは患者のアウトカムを改善させないというエビデンスの方が圧倒的に優勢です。例え、患者の30日死亡率自体をボーナスのターゲットにしたとしても、その30日死亡率を下げることにはつながらないというのは正直おどろきです。この分野の専門家(ハーバード公衆衛生大学院のAshish JhaやMeredith Rosenthal)と議論すると、P4P自体の目的は悪くないが、そのデザインに問題がある、という意見を持っている人がほとんどです。つまり、どの指標を測定するか、ターゲットをどのレベルにするか、経済的インセンティブの大きさをどれくらいにするか(全体の支払いに対するP4Pによるボーナスの大きさをどれくらいに設定するか)などの要素に関して世界は正解をまだ知らないのだと考えられています。
世界の大きな潮流としては、今までの、診療行為の量が多ければ多いほど医療機関への支払いが多くなると言う「量に対する支払い」(=出来高払い)には問題があることを多くの国が認めています。このシステムの下では、提供される医療サービスの量が最適なレベルよりもどうしても高いところでキープされてしまうからです。世界中の国が医療費高騰に苦しんでいる中で、「量に対する支払い」から、「包括支払い方式」に移行していくのは自然の流れです。しかし、包括支払い方式の一番の問題点は、医療行為を少なくすれば少なくするほど医療機関が儲かってしまうという部分です。この包括支払い方式の弱点に対抗するために導入されたのがP4Pというツールであると考えることもできます。包括支払い方式とP4Pを組み合わせることで、前者が医療機関に対してより少ない医療費でケアを提供するインセンティブを与える一方で、後者がアウトカムを良好なものにするインセンティブを与えます。包括支払い方式にすることで医療費を抑制できるのは明らかです。今我々が必要としているのは、きちんと期待通りに患者のアウトカムの改善につながるような、P4Pの正しいデザインを明らかにすることであると考えられます。