Hatena::ブログ(Diary)

shi3zの長文日記 RSSフィード

2015-05-15

人工知能は今、なにができるようになったのか

 現在、第三次人工知能ブームが起きている。


 これまで第一次、第二次の人工知能ブームはどれも失敗に終わった。

 人類は幾度も人工知能を作ろうと挑戦し、幾度も失敗した。


 しかし、成果がなかったわけではない。

 人工知能を研究することは人間の知性を研究することとほとんど一緒だ。


 人工知能を作るために研究された方法論は様々なところに応用されている。

 たとえば手書き文字認識や音声認識、検索エンジンや迷惑メールフィルター、はてはGunosyやSmartNewsなども、広義の人工知能研究の成果を応用したものと言えなくもない。


 そして第三次人工知能ブームは、深層学習(ディープラーニング)というブレイクスルーとともに広がっている。


 実は将棋でプロに勝つ人工知能やIBMのワトソン、AppleのSiriのような人工知能は、知能そのものとしては第二世代の人工知能である。


 例えばSiriは音声認識をし、自然言語を解釈するが、音声認識は第一世代の人工知能の応用技術であり、Siriの自然言語解釈は人工知能とは呼べないレベルのものだ。


 たとえばSiriに「愛してる」と言うと「他のApple製品にもそう言ってるんでしょ」と返される。

 これは素人を「おっ」と驚かせるが、Siriがユーモアを解釈したり作り出しているわけではない。その裏側にいる人間がそのセリフを書いているだけだ。いわばシーマンと同じような仕組みであり、第一世代の人工知能研究の際に人工知能とは別の、人工無能としてしばしば作られたジョーク・ソフトと同じ仕組だ。


 今、注目されている第三の波、ディープラーニングはこれまでの人工知能とは一線を画する。


 これまでの人工知能は、ごく表層的なパターン認識や、記号化された情報を扱うことしか出来なかった。

 そして「この情報を読み解く鍵はこういうところですよ」と人工知能にパターンの読み解き方を教えるのは人間だった。


 この「読み解き方」、特徴量の抽出方法を考えるのが非常な難題であり、また同時に、超えられない壁でもあった。


 ところがディープラーニングはこの「特徴量の抽出」つまり「情報の読み解き方」そのものを人工知能が学習によって導き出す。


 つまり、ディープラーニングは無数の情報を学習し、概念そのものを見つけ出すことができるのである。

 例えば無数の猫の画像を学習させると、ディープラーニングされた人工知能の中は、「斜めの線」「丸い線」などに対応する層と、その上の「毛っぽい」「ひげっぽい」「顔っぽい」「建物っぽい」という情報に対応する層と、さらにその上の「人の顔っぽい」「猫っぽい」という概念まで抽象化される。



 人工知能が見つけ出した概念に「それはネコだよ」とか「それは人だよ」という「記号」を結びつけるのは人間がしなければならないが、人工知能を使うことで人間が気づかない意外な法則を人工知能が教えてくれるかもしれない。




 というような話がこの本にまとまっている。

 第一次、第二次、第三次という3つの人工知能ブームを振り返り、今、一体何ができるようになったのか、これからどうなりそうなのか、という予想が書かれている本で、非常に面白かった。


 僕も個人的には人工知能に昔から注目していて、自分でニューラルネットワークを作ったり、人工無能を作ったりしていたんだけど、人工知能を現実の仕事に応用するにはいくつかの壁がありなかなかその壁を突破できないもどかしさを幾度も感じていた。


 たとえば文字認識を行うニューラルネットワークを作ることそのものはそんなに難しくないが、文字認識をするためにうんざりするほどたくさんの人々に文字を書いてもらって学習させるのはコスト的にキツい*1


 ディープラーニングは特徴を自分で見つけてくれるので、あとは学習させるための材料だけあればいい。


 本書を読むと、ディープラーニングは、「これなら仕事に使えるかもしれない」と期待させるに十分な技術であることがよくわかる。


 そしてIBMやGoogleやドワンゴといった会社がなぜ人工知能研究に力を入れているのか、その片鱗も伺うことができるだろう。


 しかも専門家でなくても簡単に読めるように、数式がほとんど出てこない。


 「人工知能ってなんなんだ?」と思っている人にオススメである。

*1:だからenchantMOONは文字認識を自前でやらず、MyScriptという汎用的なエンジンに頼っているのである。あとはコストバランスの問題だけだ