東京大学本郷キャンパスにほど近い場所に、先月ひっそりとオープンしたφカフェ(ファイカフェ)という施設がある。このカフェは、AIを研究したい学生や教員が無料で利用できるカフェで、電源と高速インターネット回線、そして無料で飲めるコーヒーやお茶などがある。
筆者も本郷で仕事があるときには必ず立ち寄るのだが、今日は人工生命の研究者として著名な東京大学の池上高志先生と、ドワンゴAI研究所の山川宏所長と三人で世間話がてら色々な雑談をした。
人工生命を研究する池上先生と、人工知能を主に深層学習を活用して研究している山川先生との会話の中で、不思議な共通点のようなものを感じたので今日はそれをテーマにしてみたい。
人工知能の研究者の中でも、深層学習をメインに据えている研究者は未だ少数派であると言ったら、大半の人は驚くだろう。
なぜかというと、機械学習までの人工知能の研究者にとってディープラーニング(深層学習)は未だに、得体の知れないもの、怪しいものと思われているからだ。
深層学習は機械学習の原理を応用したものなのに、なぜ応用したものは怪しく、応用していないものは怪しくないように思えるのか。
基本的に機械学習とは統計学であるため、全ての振る舞いが数式で予測できる。どの程度正しく、どの程度誤差があるのか、ということが自動的にわかるようになっているのだ。
ところが深層学習は、そういう予測が一切立てられない。「おそらくこの程度はうまくいく」ということが分かっても、「絶対にこういう振る舞いはしない」とは断言できないのだ。
筆者にしてみれば、そういうものは「そういう現象」として捉える、ということがごく自然に思えるのだが、数値解析出身の人から見れば「解析できない現象は気持ち悪い」という拒絶反応が出る。
しかしなぜ、世の中には深層学習を受け入れられる人とそうでない人が生まれるのか、もしかするとそのヒントは複雑系にあるのかもしれない、と思った。
池上先生は人工生命の研究者である。人工生命と人工知能は全く異なる。これもよく知らない人からみたら「ナンジャラホイ」という感じだから補足が必要だろう。
人工知能とは、人間の知能をコンピュータ上に再現しようという試みであるのに対し、人工生命は生命活動そのものを人工的に作り出そうとしている点が違う。
人工生命が対象とするのは基本的にバクテリアや虫などの小さい生命であることが多い。小さい生命であっても全体として意志を持つかのような行動をとることがある。こうした振る舞いを研究するのが人工生命、通称A-Lifeという研究分野である。
すぐに産業応用が目的化される人工知能と異なり、人工生命は基本的に役に立つことを想定していない。「なんだかヘンテコで面白い」から人工生命は研究されているのである。
実は昨年話題になった、国営放送で某アニメ監督にダメ出しされたゾンビの映像は人工知能ではなく人工生命である。
あれを「面白い」と言ってしまうと語弊があるが、アレをゾンビじゃない身体でやるともっと気の毒になるのでゾンビになっているのは苦肉の策なのだ。
人工生命はたとえばこの連載のタイトルバックにもなっている。これはコンウェイのライフゲームというものの画面である。
コンウェイのライフゲームとは何かというと、極めて単純なルールで構成される人工生命のことだ。
コンウェイのライフゲームでは、ぎっしりと敷き詰められた細胞(セル)が、次の時間の生死を次のような単純なルールで規定される。
- 死んでいるセルに隣接する生きたセルがちょうど3つあれば、次の世代が誕生する。
- 生きているセルに隣接する生きたセルが2つか3つならば、次の世代でも生存する
- 生きているセルに隣接する生きたセルが1つ以下ならば、過疎により死滅する
- 生きているセルに隣接する生きたセルが4つ以上ならば、過密により死滅する
(出典: Wikipedia https://ja.wikipedia.org/wiki/ライフゲーム )
ただ4つのルールが定められているだけなのに、ライフゲームは信じられないような多様な動きをする。
四世代かけて斜め方向に移動する「グライダー」パターンが有名だが、他にも無数と言って良いバリエーションがある。一定周期でグライダーを発射することを繰り返すグライダーガンと呼ばれるパターンもある。ライフゲームで万能チューリングマシンが記述できることは数学的に分かっており、すなわちライフゲーム自身でライフゲームを作ることも原理的には可能だ。
単純なルールであっても何世代も繰り返すと信じられないような複雑な動きを見せるシステムを一般に複雑系(complex system)と呼ぶ。
最も単純なかたちの複雑系をあなたは毎日目にしている。
それは太陽と月だ。
ニュートンが万有引力の法則を発見したということはイマドキ小学生でも知っている知識である。太陽と地球、地球と月など、二天体に対する万有引力の法則は数式化できる。数式化できるということは解析できるということで、数学大好きっ子の皆さんもニッコリなわけだ。
ところが太陽と地球、地球と月、それぞれ個別には数式化できるが、太陽と地球と月という三天体の間に重力が働いた時、それぞれがどのような軌道を描くかということは数式で表すことが出来ない。これを三体問題と言い、今の数学のひとつの限界点を表している。
三体問題を数値的に解決することはできないが、コンピュータなら擬似的なシミュレーションができる。それぞれの重力の相互作用をもとに⊿tを設定して瞬間瞬間を繰り返しながらシミュレーターするのだ。
これは筆者が最も好きなタイプのプログラムの一つであり、これこそが複雑系の良い教科書になっている。
f = maというごく簡単な数式を地球と月、月と地球、月と太陽にそれぞれ解き、離散積分によって加速度の変化を導き、加速度の積分によって速度、速度の積分によって位置を算出し、さらに新しい位置で同じ計算を繰り返し適用することで、擬似的ではあるが三天体の重力の相互作用がどのようになっていくかを推定することができる。
実際にプログラムを書いてみるとわかるが、互いの重力で惹かれあう星々のダンスは、極めて美しく魅惑的な軌道を描く。このような美しさは、単純な数値解析では到底たどり着けないだろう。
この複雑系のプログラムの経験があると、そもそも全ての現象を数値解析的に理解しようという発想そのものがやや傲慢であることに気づく。
現在の深層学習で起きてることも全く同じで、深層化しなければ解析的に解くことが出来る。あたかも重力が二天体なら問題なく解けるように。
しかし深層化すると、ごく単純な計算の蓄積にすぎないはずのものが、驚くほど多様で複雑な振る舞いを見せる。この性質は複雑系と似ている。
もしかすると、深層学習を受け入れるということは複雑系を受け入れるということに似ているのではないか。それが出来ない人というのは、どうしても全ての知識は数式で解析できるはずであるという幻想を捨て去ることが出来ず、ずっとそこに立ち止まってしまっているのではないか。
ある深層学習がうまくいくと、必ず「あれは○○だからうまくいくのだ」と説明する人が出てくるんだけど、もしかするとそれ自体にあまりたいした意味がないのかもしれない。それはアルファ碁の手筋を人間が解説するくらい無意味なことなのかもしれないのだ。
だってもしも深層学習が複雑系だとすれば、それを数値解析することはほとんど絶望的だからだ。だから「○○だから上手くいく」というような説明は常に後付であり、意識的に構築することがほとんど無理なのかもしれない。
最近はニューラルネットワーク自体を設計するニューラルネットワークも盛んに研究されているので、ニューラルネットワークの構造が理想的にはどうなるべきかということもそのうちどうでもよくなる可能性は高い。
自然界にあるカモノハシのような「理由はよくわからないが上手く行ってる」例というのは沢山あるので、AIもそういうものになるのかもしれない。