Hatena::ブログ(Diary)

shi3zの長文日記 RSSフィード Twitter

2017-07-03

人工知能と深層学習 07:16

 誰かがマストドンで言ってたんだけど、先週の人工知能EXPOでは「検索したいファイル名の一部を入力すると、人工知能が見つけ出してくれます」みたいなものも人工知能として紹介されていたり、いわゆるシナリオ型チャットボットも人工知能と紹介されていたり、僕は忙しくて見回れなかったんだけど、実際に来た人に聞いても「深層学習のことをちゃんと事業化している会社がほとんどなかった」というのはどうも本当らしい。


 ちなみに「検索」は実はもともと人工知能技術なので、仮に「ファイル名の一部を入力すると検索してくれる」という、Mac OSXの標準機能みたいなものであっても、「人工知能技術」と名乗っていけないわけではない。


 人工知能技術は、大きく分けて3つある。

 知識ベース処理と、機械学習と、深層学習だ。


 知識ベース処理は第二次人工知能ブームのときに盛り上がり、下火になりつつも脈々と研究が重ねられている領域で、かな漢字変換(IME)、ワールドワイドウェブ(WWW)、検索、自然言語処理、原始的な会話エンジンなどがこれに当たる。


 要は今やほとんどの部分が当たり前になっている分野が知識ベース処理で、実は全く目新しいことがない。けれども知識ベース処理にもいいことはある。それは「予測不能な振る舞いをしない」ということだ。きちんと造られた検索エンジンはハードディスクの中にある情報を取りこぼしたりしないし、かな漢字変換は辞書にある単語を提案し忘れたりはしない。


 しかし知識ベース処理の明らかな欠点は、辞書にないことや開発者が想定していないことはできないということにある。いわば知識ベース処理の人工知能は、開発者を最高の知性であると仮定し、その範囲の中でしか動作することができない。


 このようなシステムは性能はともかく開発者を満足させる。


 機械学習は、別名、統計的機械学習とも言われる。統計学を応用して大量のデータを統計的に学習し、予測モデルを作ることができる。


 統計的機械学習のメリットは、その名の通り統計であるため、やはり予測不能な振る舞いをしないことにある。機械学習でありながら、どのように学習しているかを開発者が把握できているため、やはり開発者は気分がいい。



 深層学習は、理論的な裏付けを持つ統計的機械学習から、理論的な裏付けを横に置いておいて、とりあえず「こんな感じでやったらうまくいくんじゃね?」という勘によって開発される人工知能である。


 深層学習においては、理論的な裏付けは後付で用意されるか、理論的な裏付けが全く顧(かえり)みられないことも少なくない。


 開発者は「なんとなく動いてるが果たしてこれでいいのだろうか」という漠然とした不安を常に持っている。しかし実際に動作させると統計的機械学習よりも遥かに高い性能を出してしまう。原理は統計的機械学習と似たりよったりなのに、ただ複雑化しただけでどうしてうまくいくのか、それは誰にもわからない。


 従って深層学習は開発者を不安にさせる。この不安を払拭するには、いくつも深層学習を利用した人工知能を作って実用的に使ってみる他ない。そのうち「まあこんなもんかな」と諦めがつくようになる。


 深層学習はそれ以前の人工知能に比べると多分に体育会系的なノリ、すなわち経験と勘、努力と根性に依拠した技術であるため、場数を踏んだ人だけが使いこなすことができる。


 場数を踏むために必要なのは、具体的な課題とデータと計算資源であり、僕はこの二年、これを最大化するように努力を傾けてきた。


 すなわち、まず計算資源を売ることにした。計算資源が売るほどあるということは、自動的にそれを使うことが出来るということも意味する。


 次にコンサルティングを引き受けることにした。コンサルティングの課題は、「とりあえず社長が深層学習でなんかできないかと言ってます」レベルの話で十分だ。先日のMSの社内セミナーではそういうのを筋悪案件と切り捨てたコンサルタントが居たが、難題を解決しないのならそれはコンサルティングでもソリューションビジネスでもない。単なるアルバイトである。


 僕らは金融、製造、販売、医療、メディア、ロボットなど、様々な領域に深層学習を適用してきた。ひとつひとつ丁寧に課題を解決してきたことで、僕らの中には「理屈はともかく結果はあってる」という確固たる自信が芽生えてきた。


 そもそも深層学習を適用するときに最も重要なのはインスピレーションだ。

 手持ちの道具(深層ニューラルネットワーク)をどのように活用すれば与えられた課題解決ができるか瞬時に判断する。ときには複数の手段を組み合わせたり、多段化したりする。


 そして深層学習の場合、素人が「できそうだ」と思ったことであってもたいていはできてしまうのである。

 仮にできないとしたら、計算資源が足りないかデータが足りないのだ。


 いまのところ明らかに不可能と思われるのは「自然な会話」くらいだ。だから会話エンジンを売っている会社はほぼ例外なく深層学習を使ってはいない。



 深層学習をメインにしている会社が少ない理由は3つあって、一つは新しすぎる技術であるからキャッチアップできる人がいないということ、もう一つは、深層学習を使いこなすにはなによりもまず潤沢な計算資源が必要であることだ。ここに億単位で投資できる会社じゃないと深層学習を使いこなすことはできない。最後の一つは、従来の人工知能の開発者にとって深層学習はわけがわからなくて「怖い」からだ。だから古いAIの研究者ほど深層学習を警戒する。無価値なものだと思いたがる。



 AIが人の仕事を奪うという懸念があるが、真っ先に奪われているのは古いAIの研究者たちである。と、深層学習の世界では言われている。



 彼らが人生を賭して行ってきた知識ベースや統計的機械学習の辞書や特徴量設計という仕事が、深層ニューラルネットワークというブラックボックスに飲み込まれつつあるのだ。