ワシントンの連邦議会議事堂で開かれた就任式で、演説するバイデン米新大統領=AP・共同
2019年NHK杯女子SPの審判団=木戸佑撮影

審判を審判する2020

消えないナショナルバイアス

フィギュアスケートの11段階採点法が導入されて2季目となる2019/20年のシーズンが終わった。主要大会の採点データを分析すると、ジャッジの精度が大幅に向上した反面、自国選手に対する甘い評価(ナショナルバイアス)が依然として続いていることが明らかになった。

2020/4/15 中日新聞

国際スケート連盟(ISU)の評価委員会は、演技審判の能力をチェックするため、ジャンプやスピンなどの個別要素の出来栄え点(GOE)と全体を評価する演技構成点(PCS)について、「同じ演技を見た全審判の平均からどれだけ離れているか」を計算し、この数値を逸脱点と呼んでいる。例えば、9人の審判が1、0、−1、0、0、1、0、−1、0(=平均0)と評価した場合、1を出した審判の逸脱点は1ということになる。

2019/20年シーズンの基準では、①GOE逸脱点が2.5以上、②選手ごとの平均GOE逸脱点が1.5を超える、③PCS逸脱点が1.5以上、④選手ごとの平均PCS逸脱点が1.5を超える、のいずれか1項目を誤審とみなすことになっている。自国選手に対する場合は原則2回とカウントする。採点した選手8人あたり1回を超えると警告対象になる。

11段階評価で精度は向上

出来栄え点の評価スケールは、2018年のルール改定で、-3から3までの7段階評価から-5から5までの11段評価に移行した。満点が3から5になったので、1点の大きさは3/5(=0.6)になったことになる。スケールが細分化した結果、逸脱点の分布は広がったが、実質的な評価の散らばり(標準偏差)は、17/18年の0.53から19/20年の0.44(=0.73×0.6)に縮小した=下記グラフ参照。

10002000300040005000−2−10122016/17標準偏差: 0.5310002000300040005000−2−10122017/18標準偏差: 0.53100020003000−4−20242018/19標準偏差: 0.75500100015002000−4−20242019/20標準偏差: 0.73評価のばらつきはより細い分布に11段階評価で標準偏差は実質的に2割減少データ:2016-20のシニア男女GOE逸脱点

また、誤審とみなされる異常逸脱点の頻度は、0.77%から0.32%に半減した。

ISUは、GOE評価スケールの細分化と同時に、加点・減点の基準を明確化し、審判のトレーニングにも努めてきた。しかし、スケールを変更していないPCSに目立った改善は見られない。GOEの精度は、11段階評価の導入それ自体によって、格段に向上したと言えるだろう。

消えないバイアス

自国選手と他国選手に対する逸脱点の平均の差をナショナルバイアス(自国選手びいき)とみなすことにしよう。シニア・ジュニア男女個人のすべての審判について計算したナショナルバイアスは、小さいながらもほぼ一貫してプラスに偏っている。

ナショナルバイアスは、判定の精度とは関係がない。例えば、マレーシアのIsmail SURAYU DAKSHINI氏は、逸脱点の散らばりが今季最も大きかった審判だが、自国びいきはほとんどない。逆に、最も精度の高いジャッジをしたスロバキアのAndrea SIMANCIKOVA氏には、平均的なナショナルバイアスがある。

最大のナショナルバイアスを記録したのは、ギリシャのAnna CHATZIATHANASSIOU氏で、ただ一人1.0を超えている。最小はフィンランドのPia ALHONEN氏で、自国選手に非常に厳しかった。いずれも審判を務めたのはジュニアの1大会のみであり、選手の実力のばらつきが影響した可能性がある。

204060−3−2−10123逸脱度:大きいほど甘い評価。対象はシニア・ジュニア男女全ての選手に対する逸脱点の平均0.02同じ国の選手に対する逸脱点の平均0.52ジャッジの逸脱点(要素点)全体の分布はグレー、同国選手はMs. Agita ABELE2019/20−1.0−0.50.00.51.0グレーの帯は全審判の分布。●は有意差あり0.500.430.200.042016/172017/182018/192019/20ナショナルバイアスの推移

11段階評価では、ナショナルバイアスも0.6倍して比較する必要がある。全審判の分布を見る限り、GOEバイアスは縮小傾向にあると言えるだろう。

演技構成点のナショナルバイアスも、依然としてプラスに偏っている。

20406080−3−2−10123逸脱度:大きいほど甘い評価。対象はシニア・ジュニア男女全ての選手に対する逸脱点の平均-0.07同じ国の選手に対する逸脱点の平均0.04ジャッジの逸脱点(要素点)全体の分布はグレー、同国選手はMs. Agita ABELE2019/20−1.0−0.50.00.51.0グレーの帯は全審判の分布。●は有意差あり0.100.190.240.352016/172017/182018/192019/20ナショナルバイアスの推移

ナショナルバイアスは、国別に計算すると、より一層明らかになる。

次の図は、選手数の多い9カ国について、国間バイアスを計算したものだ。横軸に選手の国、縦軸に審判の国を同じ順で配置しているため、対角線上の値がナショナルバイアスになっている。最近4年間、すべての国でプラス(赤系の色)だった。欧州3国は、年によっては露骨な自国びいきを示している。

0.270.290.03-0.09-0.04-0.100.200.02-0.12-0.110.49-0.32-0.240.09-0.160.310.110.16-0.190.280.29-0.090.070.000.06-0.17-0.040.08-0.110.25-0.04-0.15-0.24-0.23-0.30-0.090.45-0.29-0.060.130.10-0.320.03-0.050.04-0.110.06-0.150.060.22-0.190.070.04-0.04-0.100.19-0.120.040.010.17-0.080.03-0.20-0.30-0.200.00-0.05-0.030.130.130.00-0.11-0.120.28-0.070.00-0.04-0.06-0.020.26USACANRUSFRAITAGERJPNKORCHNUSACANRUSFRAITAGERJPNKORCHN選手と審判の国間バイアス(出来栄え点)自国びいき(対角線上)は一貫している横軸は選手、縦軸は審判の国。は甘い、は辛い採点を表す2018/19

バイアスは、ライバル国に対しても生じている。例えば、アメリカとロシア、カナダとフランスは相互に一貫してマイナスのバイアスがあった。アジア3国の間にはそういった傾向は見られなかった。

異常なジャッジの頻度

競技会場で選手や観客が感じる不公正は、逸脱点が1.5以上になる過度に高い評価を自国選手に与えたり、-1.5以下になる低評価を他国選手に与える場合だ。

以下の表は、統計的指標の一つである独立性検定のp値という観点で、2018/19年と19/20年に異常なジャッジをした審判のリストだ。いずれも、高い頻度で自国選手に甘い評価を与えている。ただし、この場合もジュニア選手の場合がほとんどで、選手の力のばらつきが影響した可能性がある。他国選手に過度の低評価を与えた審判はいなかった。

異常な逸脱点が多いジャッジ
自国に過度に甘い。他国に過度に厳しい例はない
名前自国選手に対して他国選手に対して
逸脱+逸脱-要素数逸脱+逸脱-要素数
18Ms. Zsuzsanna VIKARNE-HOMOLYAHUN603331191113
18Ms. Irina KOMARNICKALAT3016825569
18Ms. Nadezhda PARETSKAIAKAZ507127321804
18Mr. Samuel AUXIERUSA6089934709
18Mr. Yury BALKOVUKR8017479715
18Ms. Anna KANTORISR4034318375
18Ms. Stanislava SMIDOVACZE628517151070
18Mr. Philippe MERIGUETFRA7056145641
18Ms. Halla Bjorg SIGURTHORSDOTTIRISL307625201
18Ms. Florence VUYLSTEKERFRA301833195
19Ms. Zsuzsanna VIKARNE-HOMOLYAHUN40341215996
19Ms. Miriam PALANGEITA2034319757
19Ms. Salome CHIGOGIDZEGEO60717391041
19Mr. Roger GLENNUSA6473724580
19Ms. Anna CHATZIATHANASSIOUGRE20833319
19Ms. Jia YAOCHN2016113197
数字は順に逸脱点が+1.5以上の回/-1.5以下の回/要素回

今季の焦点は利益相反

ISUは、今季のルール改定で、審判団を司るレフェリーと、要素のレベル認定を行う技術審判(テクニカルコントローラーら)に関する倫理規定を厳格化した。

ISUの主要大会では、出場選手の親族や名付け親、友人などの「特別な関係」がある場合、出場選手とライバル関係にある選手のコーチである場合、主要大会参加選手のコーチである場合に、レフェリー・技術審判を務めることが禁止された。また、各国のスケート連盟の幹部がレフェリー・技術審判を務めることも禁止された。シニア大会では、可能な限り、上位が見込まれる国からの任命を避けることになった。

五輪ではさらに厳しくなり、直前の世界選手権で5位までに入賞した国のレフェリー・技術審判は忌避されることになった。他国の国内大会でレフェリー・技術審判を務めた場合も同様だ。なお、審判も、他国国内大会で審判、レフェリーなどを務めた場合、各国連盟の現役会長である場合は忌避されることになった。

技術審判のレベル認定は、演技審判が出来栄え点を判断する前提となるため、結果を大きく左右する。しかし、同時に9人が採点する演技審判と異なり、データの中にバイアスを見出すことは難しい。

コントローラーと減点ジャンプ
独立性検定のp値が小さい15件
シーズン種目自国選手他国選手p値
減点回要素数減点回要素数
2016/17個人FRA26320715340.047
2019/20個人USA6731397520.080
2017/18個人RUS177131560.084
2018/19個人KOR519161860.091
2019/20ペアITA43692660.116
2017/18個人POL0181105770.129
2019/20個人ISR018945140.140
2016/17個人USA86091600.144
2018/19個人HUN01817310450.167
2018/19ダンスUSA01622213530.203
2019/20個人RUS5551327400.211
2019/20個人HUN01815310760.216
2017/18ダンスRUS22342010.260
2018/19個人SWE018585040.299
2017/18個人SUI019535370.340
薄い赤は自国の方が減点判断が少なく、薄い青は多い

自国選手の減点がやや少ない印象があるが、多くは有力選手を輩出している国であることを考慮すると、統計的な偏りはほとんどなかったと言えるだろう。

公平なジャッジとは

ケーキを二人で分けるとき、公平なやり方は一つではない。天秤を使って同じ重さになるように分ける方法は一見科学的だが、デコレーションは切り刻まれてしまう。切った人と別の人が先に選ぶ方法は賢い知恵だが、前提として二人が独立した存在でなければならない。採点基準の細分化は前者、倫理基準の厳格化は後者に当たる。

ルールは、現実に振り回されながら見直される。前半に偏りがちだったジャンプが競技時間の中で均等に配分されるように、後半の点数を1.1倍にするルールが導入されると、当初の意図に反して、ジャンプを後半だけに集中する選手が現れた。くじ引きで審判を割り振る手続きは十分な公平性を担保すると思われていたが、よりによって五輪で有力国の連盟会長が審判に選ばれることが起きてしまった。競技が重視する価値とは何か、公平とは何かは常に問われる。

選手とルールの相克はどのスポーツにもあるが、フィギュアスケートでは審判制度も加わってことさらに複雑だ。審判制度の微調整はこれからも続いていくだろう。

データについて 分析に用いたデータは、2016年から4年間の国際スケート連盟主催大会(シニア、ジュニア、五輪を含む)の男女個人、ペア、アイスダンスについて採点資料から集計した。逸脱点の集計ではジャンプの転倒などで審判全員が最低点を出した場合を除いた。GOEは720,634件、PCSは444,520件。