Home »
その他 »
佐村河内問題へのコンピュータビジョン的アプローチ

佐村河内問題へのコンピュータビジョン的アプローチ

On 3月 10, 2014

序論

近年、全聾の作曲家とされた佐村河内守氏がゴーストライターを用いていたことを告白し、同時に障害者手帳の不正受給も疑われ、大きな問題となっている。その報道の中で、佐村河内氏の容姿が多くの著名人と酷似していること、2月の会見と3月の会見で外見が大きく変化したことが話題となった。

具体的には、2月の会見の時点で話題になったものが

笑佐村河内を探せ！（勝手に改訂版） pic.twitter.com/3TLFm14PvZ”

— FACT (@factjapan) February 7, 2014

であり、3月の会見を踏まえて修正されたものが

佐村河内を探せの最新版ｸｿﾜﾛﾀ pic.twitter.com/ptNhxecCW4

— 天才指揮者bot (@Siegfried_Idyll) March 7, 2014

である。

ここで興味深いのは、佐村河内氏の顔をコンピュータに学習させ、これらの顔画像から佐村河内氏を正しく見分けさせることができるか、という問題である。本記事では、コンピュータビジョン的な観点からこのような問題に取り組み、初歩的な実験の結果を示す。

なお、ここではゴーストライター問題や全聾問題などについては一切扱わないので注意されたい。ちなみに、筆者は以前に「捏造エピソードが有名なベートーヴェンの楽曲5つ」という記事において佐村河内問題に言及している。

問題設定

まず想定されるタスクは、何らかの方法により佐村河内氏の顔を学習しておき、それをもとに

および

から佐村河内氏の顔を特定することであろう。しかしながら、ここでは「何らかの方法により佐村河内氏の顔を学習」する際にどのようなデータを用いるかが問題となる。佐村河内氏の顔画像を手動で多数用意し、それをコンピュータへ覚えこませるのは非常に面倒である。

そこで本記事では、上記の佐村河内画像群（旧）を用いて佐村河内氏の顔を覚えさせ、その結果を元に佐村河内画像群（新）から佐村河内氏を発見させることとする。具体的には、一般的に用いられている顔検出器 [Viola and Jones, IJCV, 2004] を用いて顔画像を抽出し、以下のような佐村河内データセットを構築した。

学習用の画像

佐村河内画像

非佐村河内画像

テスト用の画像: 佐村河内氏はどれ？

以上が佐村河内データセットである。顔検出器の精度が十分ではなく、一部の顔が検出されておらず、また顔ではない部分が検出されているが、手動で修正するのは面倒であるため無視していただきたい。

なお、これは Fine-grained Classification （「犬/鳥」の識別ではなく「柴犬/秋田犬」の識別を行うなど、より詳細なレベルで識別を行うこと）と Transfer Learning （学習に使用するデータと識別対象となるデータの性質が大きく異なる設定での機械学習）が組み合わさった非常に困難なタスクである。

実験

佐村河内画像群（旧）を用いて佐村河内氏の学習を行い、佐村河内画像群（新）の佐村河内氏らしさを算出した。実験の結果を以下に示す。数値が高いほうが佐村河内氏である自信度が高い。

画像
佐村河内度	0.927	0.869	0.911	0.880	0.978	0.938	0.933	0.894

佐村河内度がもっとも高い画像は

であるとの結果が得られた。なんとこれは、佐村河内氏の3月の会見の画像である！

結論と展望

実験により、佐村河内画像群（旧）のみで佐村河内氏の顔を学習した機械が、佐村河内画像群（新）から佐村河内氏を特定できることが示された。2つの画像で佐村河内氏の外見は大きく変化しているが、それにも関わらず機械は佐村河内氏を選出することが可能である。これは驚くべき結果である。

本設定では、データセットがきわめて小さく、実験の結果が単なる偶然である可能性は否定できない。さらなる検証のため、より大きな佐村河内画像データセットの構築が望まれる。また、実験の結果では佐村河内画像と非佐村河内画像との佐村河内度の差は比較的小さく、識別器はすべてを非佐村河内と判定する。正しい識別結果を返す識別器を得る手法の開発が望まれる。

また、本記事は、たまたまインターネット上で佐村河内画像群を見つけてしまったために書かれたものである。筆者の実感としては、「なんでこんなことしてるんだろ…時間の無駄じゃないの…」である。今後このような事態が引き起こされることのないよう、インターネットの皆様には不要なデータセットの整備を行わないようお願いしたい。