ディープラーニングをコンピューターを人間に近づける技術にしてしまって良いのだろうか?[コラム]
従来の機械学習の何倍もの規模のデータを扱うことが可能な「ディープラーニング」は、ともすればAIを画期的に飛躍させる手法だと思われがちであるが、実は微妙に違う。
より人間的な判断が行えるようになる事と、コンピューティング的なAIでは、その使いどころが変わってくるはずだ。その前提として、人はコンピューターに何を求めているのかを考える必要がある。
しかし、自然な受け答えをするAIは、本当に便利なのだろうか。人がコンピューターにモノを尋ねる場合、それは明確な答を期待している。1+1=2と確実な計算結果を教えてもらいたいから、コンピューターを利用するのであって、コンピューターに人生を教えてもらいたいわけではないし、気の利いたジョークを言ってもらいたいわけでもないだろう。
映画やドラマのAIは、まるで人間のように話し、相棒のように振る舞う。それはとても魅力的な世界だけれど、それがビジネスの上でのことになると、かなり邪魔臭いのではないかと容易に想像できるはずだ。楽しい会話は、すぐに答が欲しい時に必要ないし、言ってしまえば、コンピューターにそれを求めなくても、楽しく話してくれる人間は、多分、AIよりも安価に、酒場などで会話に付き合ってくれる。
検索結果における、個人ごとのマッチングに対してディープラーニングが有効ではないかという考え方もある。これは、もしかしたら実現するかも知れない。「今の私にもっとも似合う服を選んで?」と言うと、ネット上のショップから選んだ服をコーディネートして提示する機能というのは、既に一部では実現している。上手く動くなら、とても有効なサービスだし、多くの利用者が集まりそうだ。
こういう、他の人には分からない、様々な人の微妙な共通点や特長を見つけ出して、それに対して最適な回答と、その周囲の曖昧な答を導き出す、という作業はディープラーニングを使ったAIの得意技。しっかりと体形などのルックスのデータと、服飾のデータを学習していれば、有能なアパレルショップの店長のように、「似合う服」という曖昧な概念に対して、答に近い何かを提示してくれる。
これが、ディープラーニングの本領なのだけど、これは、全国あらゆる土地のアパレルショップには1人はいる、というような種類の能力。もっと希少な、例えば陶芸の大家が、気に入らない作品をたたき割る前に、その作品が割られるか割られないかを判定する、つまり大家にしか分からなかった作品上の瑕を見つけ出すことができるのも、ディープラーニングの可能性だ。
つまり、ディープラーニングに求められているのは、「人としての判断力」。顔認証システムの現在の問題点として、よく挙げられるのが、「屋外では気候が変わるだけで認識率が下がる」問題。従来の機械学習では冗長性を盛り込むのが難しいため、光の変化や、変装などに対して弱い部分がある。そこをディープラーニングで埋めることで、設置場所を選ばず顔認証が行える。
それはつまり、人が見張ってるのと同じ状況を無人で行いたいというだけのことに過ぎない。ならば、コンピューターの持つ正確さや冗長性の無さを道具として使いこなす方が、もしかしたら重要ではないかと思ってしまうのである。
全てを完全に覚えてしまい、ほんの少しでも記憶と違うものがあるだけで、それは記憶と違うもの、つまり別のものと判断する。「百舌の早贄」という言葉は、百舌がせっかく冬の食料として樹の枝に挿しておいた獲物を、食べにくるのを忘れている内に干からびてしまっている状態を言うけれど、あれも、忘れるのではなく、雪が降って景色が変わるから、自分が知っている場所ではないと判断してしまうことで起こるのだそうだ(この話は、かつて、東京大学大学院薬学系研究科教授の池谷裕二氏に取材して聞いた話だ)。
通常、人間は忘れることで記憶の中に時間軸を持ち込み、記憶に距離を作る。だから、いわゆる「完全記憶」の人は大変らしい。1年前と一瞬前の間に違いがないから、全てが同じ距離で並んでいて、どれがいつの記憶かが分からなくなるのだという。つまり、人間にとっては「忘れる」ことは生きていく上で必要なことなのだ。
そんな冗長性や、直勘、センス、といったものをコンピューターに教える技術としてのディープラーニングとニューラルネットワークは、コンピューターを少しバカにして、ふわっとした答を要求する技術。そして、それが確かに、今後重要になっていくような気がするのもよく分かる。
ここで、最初の問いに戻ってくるのだけど、では、人はAIを人間に近づけて、何をさせたいのだろう。もし、それが、単に労働力として人間の代わりをさせられる、というのであれば、それこそ非効率的である。ディープラーニングを有効に使うために、どれだけの量のデータを集めなければならないか。従来の機械学習では扱いきれない、数千万単位の膨大な量のデータを扱うからこそのディープラーニングなのだ。
数十万単位のデータでよいなら、従来の機械学習で十分なのだ。ディープラーニングを、本当の意味で「使える」技術にするために、私たちはまず、AIに何を求めているかを問い直す必要がある。
より人間的な判断が行えるようになる事と、コンピューティング的なAIでは、その使いどころが変わってくるはずだ。その前提として、人はコンピューターに何を求めているのかを考える必要がある。
人間に近いコンピューターという夢
人間はAIに何を期待しているのだろう。ディープラーニングへの期待を目にするにつれ、そう考える人は多いのではないだろうか。ディープラーニングが実現するAIは、より人間的なものと言って良いものだ。例えば、コンピューターとの会話における自然な受け答えや、臨機応変な対応などは、ディープラーニングに対する期待の中でも大きなものだろう。何より、結果が分かりやすい。しかし、自然な受け答えをするAIは、本当に便利なのだろうか。人がコンピューターにモノを尋ねる場合、それは明確な答を期待している。1+1=2と確実な計算結果を教えてもらいたいから、コンピューターを利用するのであって、コンピューターに人生を教えてもらいたいわけではないし、気の利いたジョークを言ってもらいたいわけでもないだろう。
映画やドラマのAIは、まるで人間のように話し、相棒のように振る舞う。それはとても魅力的な世界だけれど、それがビジネスの上でのことになると、かなり邪魔臭いのではないかと容易に想像できるはずだ。楽しい会話は、すぐに答が欲しい時に必要ないし、言ってしまえば、コンピューターにそれを求めなくても、楽しく話してくれる人間は、多分、AIよりも安価に、酒場などで会話に付き合ってくれる。
検索結果における、個人ごとのマッチングに対してディープラーニングが有効ではないかという考え方もある。これは、もしかしたら実現するかも知れない。「今の私にもっとも似合う服を選んで?」と言うと、ネット上のショップから選んだ服をコーディネートして提示する機能というのは、既に一部では実現している。上手く動くなら、とても有効なサービスだし、多くの利用者が集まりそうだ。
こういう、他の人には分からない、様々な人の微妙な共通点や特長を見つけ出して、それに対して最適な回答と、その周囲の曖昧な答を導き出す、という作業はディープラーニングを使ったAIの得意技。しっかりと体形などのルックスのデータと、服飾のデータを学習していれば、有能なアパレルショップの店長のように、「似合う服」という曖昧な概念に対して、答に近い何かを提示してくれる。
これが、ディープラーニングの本領なのだけど、これは、全国あらゆる土地のアパレルショップには1人はいる、というような種類の能力。もっと希少な、例えば陶芸の大家が、気に入らない作品をたたき割る前に、その作品が割られるか割られないかを判定する、つまり大家にしか分からなかった作品上の瑕を見つけ出すことができるのも、ディープラーニングの可能性だ。
つまり、ディープラーニングに求められているのは、「人としての判断力」。顔認証システムの現在の問題点として、よく挙げられるのが、「屋外では気候が変わるだけで認識率が下がる」問題。従来の機械学習では冗長性を盛り込むのが難しいため、光の変化や、変装などに対して弱い部分がある。そこをディープラーニングで埋めることで、設置場所を選ばず顔認証が行える。
それはつまり、人が見張ってるのと同じ状況を無人で行いたいというだけのことに過ぎない。ならば、コンピューターの持つ正確さや冗長性の無さを道具として使いこなす方が、もしかしたら重要ではないかと思ってしまうのである。
コンピューターを人間に近づけようとするのは間違い?
人に近づけるというのは、ある意味、コンピューターの頭を悪くすることでもある。例えば「鳥頭」という言葉があって、鳥は脳が小さいから3歩歩く時間で前のことは忘れている、という俗説を元にした忘れっぽいことの表現だが、実は、鳥は驚くほど記憶力が良いそうだ。全てを完全に覚えてしまい、ほんの少しでも記憶と違うものがあるだけで、それは記憶と違うもの、つまり別のものと判断する。「百舌の早贄」という言葉は、百舌がせっかく冬の食料として樹の枝に挿しておいた獲物を、食べにくるのを忘れている内に干からびてしまっている状態を言うけれど、あれも、忘れるのではなく、雪が降って景色が変わるから、自分が知っている場所ではないと判断してしまうことで起こるのだそうだ(この話は、かつて、東京大学大学院薬学系研究科教授の池谷裕二氏に取材して聞いた話だ)。
通常、人間は忘れることで記憶の中に時間軸を持ち込み、記憶に距離を作る。だから、いわゆる「完全記憶」の人は大変らしい。1年前と一瞬前の間に違いがないから、全てが同じ距離で並んでいて、どれがいつの記憶かが分からなくなるのだという。つまり、人間にとっては「忘れる」ことは生きていく上で必要なことなのだ。
そんな冗長性や、直勘、センス、といったものをコンピューターに教える技術としてのディープラーニングとニューラルネットワークは、コンピューターを少しバカにして、ふわっとした答を要求する技術。そして、それが確かに、今後重要になっていくような気がするのもよく分かる。
ここで、最初の問いに戻ってくるのだけど、では、人はAIを人間に近づけて、何をさせたいのだろう。もし、それが、単に労働力として人間の代わりをさせられる、というのであれば、それこそ非効率的である。ディープラーニングを有効に使うために、どれだけの量のデータを集めなければならないか。従来の機械学習では扱いきれない、数千万単位の膨大な量のデータを扱うからこそのディープラーニングなのだ。
数十万単位のデータでよいなら、従来の機械学習で十分なのだ。ディープラーニングを、本当の意味で「使える」技術にするために、私たちはまず、AIに何を求めているかを問い直す必要がある。