9月から始まるProduct Academy第2期に日本人の参加が決まった。世界一とも言われる米国の名門大学でCSを選考する優秀な学生だが、大学ではウェブ・モバイルアプリなどリーンスタートアップを始めるためのプロダクト開発のスキルを身につけられないことで悩んでおり、Make Schoolを見つけてきてくれた。同じように悩んでいる日本の大学生・大学院生や企業のエンジニアにもチャレンジしてほしい。今年サンフランシスコで行われているSummer AcademyにはVRトラックに参加する1名しか日本人がいない(追記:以前ブログを見て相談してきてくれた方が今週から始まるIntro Track2に参加予定だ)。対照的に、他の国からの参加者は増えているので、非常に残念だ。不安なこと、分からないことがあれば是非相談してもらえればと思う。

Make Schoolの1年目が終わってから、ベイエリアにある様々な大学の研究室を訪問させてもらっている。最もホットな分野だと感じるのはAIだ(なお、以下では人工知能と機械学習は明確に区別していない)。Google、Facebook、OpenAIといった企業とスタンフォードやUCバークレーの研究室がトップをひた走る。日本企業もなんとか追いつこうと、大学に研究員を送り込んでいる。しかし、彼らはトップ集団との絶望的なまでの差、企業からの期待と現実のギャップに苦しんでいるようだ。予め断っておくが、筆者はこの分野の研究者ではないので偏った書き方になってしまうと思う。一意見として捉えてもらえれば幸いだ。

世界的な学会では蚊帳の外、差は開くばかり

日本には、二度の冬の時代を越えて生き残り、世界の第一線で発言力のある研究者がほとんどいない。昨今のAIブームを解説する研究者の顔ぶれを見てもわかるとおり、冬の時代に研究予算が打ち切りになってしまったことで、油の乗り切った50代の研究者が残っていないのだ。また、日本の研究の強みの一つは特徴量の生成にあったが、ディープラーニングではその強みは(今のところ)生かせない。

実際、機械学習の分野では世界的な学会、ICML(International Conference on Machine Learning)には日本人の存在感が無いようだ。先月行われたICMLの学会ホームページを確認してみたところ、確かに期間中行われる20数個のワークショップのうち日本人の主催するものは全く無いようだし、発表も数えるほどである。最先端の研究を知らない、学会に参加していないが故に、筋の良い研究の方向性を定められず、またそれ故に学会にも出られないという悪循環が続いている。

学会に人を送り込めないことによる機会損失は大きい。公開されている論文を読めばよい、という人もいるかもしれないが、まだ知見が属人的であるため、文献から得られる情報だけではキャッチアップには不十分だ。その様子は自分の知る一般的な学会とは異なり、まず参加者は発表論文を全て読んだうえで臨む。研究室では自身の研究分野に関わる論文を知らないのは論外で、基本的には発表前の論文であってもarXivアーカイヴ)で入手し、学会未発表論文どうしがリファレンスし合うということが行われている。学会発表の場は、まだ手探りで進められることが多いパラメータの調整など、論文に書かれていないことが議論の中心だという。

世界トップ研究者の戦略とマネジメント

このような激しい研究の世界において、世界的な研究者はしたたかだ。例として聞いたのはTRI (Toyota Research Institute)でも活躍するスタンフォード大学教授Fei-Fei Li氏の話だ(TED Talkでも有名だ)。彼女はディープラーニングの時代にはアノテーション付きのデータが重要になることをいち早く見抜き、ImageNetという画像データベースを無償で公開した。現在、彼女の研究室では公開中のデータベースの二段階先までネタを仕込んであるという。世界に先駆けてデータを公開し、学会を巻き込むことによって、研究でそのデータを使うことがスタンダードであるよう位置づけ、フォローワーを増やす。自身はさらにその先に仕込んであるデータを使うことにより、他者に先駆けて研究成果を出すことができる。競争の激しい分野でも自らを常にトップランナーに位置付けるための仕組みを構築しているというわけだ。

こうした研究分野の戦略的な構築方法に加え、米国の研究者は自身の研究のマーケティングに長けている。ディープラーニングのブレークスルーは2006年にカナダの研究者によって発表されたが、アカデミアの外で話題になり、お金がつきだしたのは2012年にGoogleによる猫の認識の例をはじめ、シリコンバレーの研究者たちが一般人に分かりやすいような成果を上げ始めてからだろう。当然完全な成果ではないのだが、適切なタイミングと見せ方によってブームを作り出すことに成功した。

教授が多忙になるなかで研究室のマネジメントが疎かになるという話はよくあると思うが、スタンフォード大学の研究室では学生の指導と進捗管理をシステマチックに行っている。具体的には、教授が思考ならびに成果報告に必要なフレームワークを提供している。そのフレームワークに設定された質問に答えられるかを学生が自ら問答しておくことで、クリティカルシンキングのスキルが鍛えられる。そして、教授との限られた時間の面談においては、準備不足・方向性の相違といった基本的なミスを防止し、また、先行研究との差分を如何に出すかということに注力することができ、結果的には学生自らも世界的な成果を出すことで好循環に入っていくことができている。自前主義には拘らず、世の中にあるものは積極的に使うという方針のため、日本の研究現場で起こりがちな、いわゆる「車輪の再開発」のようなことは言語道断だ。

キャッチアップするにはトヨタ流がベストだが・・・

最先端で戦っている研究者がいない、学会でも存在感を発揮できない、キャッチアップしづらい仕組みが先行者により構築されつつある、研究室の運営と学生のレベルにも差がある、という苦しい状況のなかで、どうすれば日本の大学や企業はキャッチアップしていくことができるだろうか。

AIの研究は人に根付く。とすれば、最も手っ取り早いのは、トップ研究者をヘッドハンティングしてくることだ。その点、トヨタのAI分野における5年で約10億ドルという投資、Gill Pratt氏やFei-Fei Li氏といったキーパーソンの長期間の囲い込みはベイエリアでも評価されている。トップ研究者が一定の成果をあげ、また、周りの人たちがそのノウハウを吸収するには最低5年は必要だろう。日本企業は景気が悪くなるとすぐに投資を引き上げるという悪い評判があるなかで、トヨタが長期間のコミットメントを示せたことが良かったし、流石に戦い方がわかっているようだ。

ただ、大半の会社はトヨタほど余裕が無いので、現実的な打ち手として取られているのが少額(年間1~数千万円)を払って数年間、自社の研究員を送り込むという方法だ。これにより、送り込む側は世界最先端の人工知能の技術を自社に取り込み、また、事業化に必要なネットワークを構築する、という目論見を持っている。しかしながら、送り込まれた側の話を聞いていると、そんなに簡単な話でもなく、理想と現実にはギャップがあるようだ。

甘くない現実、ギャップを埋めるには

研究者を直接雇用できない以上、知見の獲得は送り込まれる研究員に全てがかかっているが、お金を払ったからといって知見を獲得できるとは限らない。研究員として企業から派遣される人たちは各企業のホープであり、皆とても優秀だ。しかしながら、冒頭に述べたように日本でまともに人工知能の研究ができる研究室は限られており、輩出される人材も絶対数が少ない。また、大学がそんな状況のなかで一企業においてこれまで人工知能の研究の蓄積があるはずもないから、結果的には大学では情報系の専攻ですらないという人が送られてくる。そして、英語と専門の両方で苦しむことになる。

こうした人が日本で使っているツールと、アメリカの研究室で使われているツールは異なる。アメリカの研究室では、OSはMac/UnixでTerminalを使い、言語はPython、最新の論文で使われているフレームワークは日本で流行っているChainerではなくCaffeやtorchが主流だ。細かなパラメータ調整といったノウハウを地道に学び取っていくことが重要な場において、慣れないツールと英語は大きなハードルになっているという。また、苦労の末にノウハウを会得して持ち帰ったとしても、日本にそれを同じレベルで理解できる人はおらず、ツールの講習から始めなくてはならない。

トヨタ流の検討余地がある企業はすぐに行動すべきだし、そうでない企業の場合はもっと草の根的な活動が必要だ。コーディングのスキルは研究におけるクリティカル・シンキングは最先端の研究室でなくとも学べるはずだ。日本の大学・企業は意味のないプライドは捨てて、まずはこうした小さなことから改善していく必要があるだろう。東大でも研究者育成講座を作ろうとしているようなので、期待したい。