今回は、ディープラーニングのマルチモーダル化を実現させるかもしれない、興味深い最新の動向を紹介しておきます。
それは、「言語の処理も画像としておこなう」という手法の登場で、これが最近少なからず賛同者を増やしているようなのです。
そのしくみを簡単に解説するのは非常に難しいので泣く泣く省略しますが、驚くことに、このアプローチが意外とうまくいくようなのです。
この手法の評価が高いのには、大きな理由があります。それは、ここまで何度か言及したように、ディープラーニングは画像の処理が最も得意だからです。
ですから、言語であれ何であれ、なんとか画像と結びつけることができたなら、それは一気にディープラーニングの得意な対象になり、人間を超えてしまえるのです。
そして、画像は非常に多くの情報を表現することができます。どんなものでも画像にできれば、「縦と横の関係」として表現できるのです。そして縦と横の関係は、距離的なものだけでなく、時間的な近さすら表すことができます(数学のグラフは、距離も時間も表現できましたね)。
ここからは完全に私の想像ですが、さらに議論を進めると、もしかしたら「知能とは画像である」と言うことすらできるかもしれません。
考えてみれば、私たちがふだん脳内で見ているのは、3次元を2次元にした画像だと言うことができます。逆に、1次元の数字の列をわざわざ手間をかけて2次元の画像(グラフ)にして解釈したりもします。
つまるところ、人間は2次元の画像にできるものしか認識できないのではないでしょうか。だから私たちは4次元の世界を認識できない、ということも考えられます。
また、人間の目は脳の付属物などではなく、目があったから脳が進化したという話もあるようです。人間の眼球と脳との密接につながりは、「画像が知能の本質」であることの証拠なのかもしれません。
還元主義的な科学からの卒業
第10回から続けてきたディープラーニングの解説についてまとめます。
私たちが普段の教育で触れる科学は、基本的に還元主義でできています。それは「物事を分解し、細部の構造を理解していけば、全体を理解できる」という考え方です。科学者でなくても、この考え方に賛同する人は多いと思います。
還元主義は決して悪い考え方ではありません。
たとえばあなたが時計というものを完全に理解しなければならないとしたら、まずすべての部品を分解して、歯車やゼンマイの仕組みを知り、それぞれの動作を把握するはずです。
そして今度はそれらの部品を再度組み立てます。そうした作業をへて、時計という機構は理解できるようになるのです。
熟練の時計職人であれば、時計がどのような仕組みで動き、どうすれば性能を上げることができるのかを明確に説明することもできるでしょう。
ただし、知能を理解するには、この還元主義的な考えではうまくいきません。
私は10年間ポナンザを作ってきたのですから、世界でいちばんポナンザのことをわかっています。でも、なぜポナンザが強いかについて、私は100%説明することはできません。
すでにお話ししたように、今のポナンザは実験的・経験的にしか強くすることができませんし、どれだけ詳細にプログラムの細部を調べていっても、ポナンザの知能というものを理解することはできません。
わかりやすく言えば、もし今のポナンザのデータがすべて失われたら、同じ状態のポナンザを作ることは、私でも不可能なのです。
ディープラーニングも同様に、還元主義の考え方では理解することができません。
現代のディープラーニングは、以前のニューラルネットワークと違い、さまざまなテクニックを駆使しています。しかしそれらのテクニックはほぼ黒魔術化しています。
それらの黒魔術はまだ技術的に安定しておらず、結果を出すのに職人芸的なノウハウが必要です。自然科学ならともかく、コンピュータという基本的に同じことをしたら同じような結果を返してくれる実験環境ですら、職人芸が必要なのは不思議ですよね。
その結果なのでしょうか。以前の機械学習の現場では、数理的な数式を使った説明がたくさんありました。しかし最近の機械学習の文脈では、数式ではなく、「ディープラーニングの気持ちについて」語る人が増えたと思います。
複雑すぎて数理が見えないものに対して、人間は「気持ち」で推し量るしかないのでしょうね。私も将棋プログラムについて考えるときには、数理よりも「ポナンザの気持ちについて」推し量ることが多くなっています。
別分野の科学者にそうした状況を解説したところ、「人工知能は科学ではない」と言われたことがあります。私はその言葉に非常に納得しました。
もちろん、その人は人工知能のことを批判する意味で言ったわけではありません。要素を切り分けて個別に理解していくという、還元主義的な科学の思想とは相容れないことを指摘したのです。
結局、知能というのは隠された方程式があって、それを解き明かすのではなく、どこまで行ってもモヤモヤしたよくわからないものであることを受け入れるしかない——それが今の人工知能の研究者たちの実感なのです。
このように、人工知能はプログラマからの卒業に続いて、科学の還元主義からも卒業しようとしています。次は何から卒業するのでしょうか?