▶データが増えれば増えるほど性能が向上
人工知能が進化し始めたと書くと、人間の脳の仕組みそっくりにコンピューターを組み立てることができるようになった、と勘違いされるかもしれない。いや現時点ではそんなことはできない。米国の著名なコンピューター研究者のJaron Lanier氏は言う。「われわれはまるで人工の脳を作り出したかのように語るけれど、ある意味ウソをついている。人間の脳のこと自体、まだほとんど分かっていないのに、それを真似た人工の脳など作れるわけはないんだ」。Lanier氏によると、今日の人工知能の多くは、人間の脳が生み出した情報を集めてきてそれを検索するコンピューターでしかない。
ただ膨大な情報を集めて処理し、的確に検索できるようになってきた。なのでその検索結果だけ見れば、まるでコンピューターが自ら情報を考えついたかのように、的確な情報がはじき出されるようになってきている。
例えばGoogle検索でキーワードのスペルや漢字表記を間違うと「もしかして」と正しい表記を聞き直してくる。これは利用者が増えてきたことで、どのような入力間違いが多いのかというデータが蓄積されてきたからこそ可能になった機能だ。
利用が増えることで、入力間違いも増える。ありとあらゆる間違いが記録され、その中でどのような間違いが最も多いのかも分かってくる。もしよくあるミススペルや誤字が検索窓に入力されれば、Google検索エンジンのほうで「もしかして」と聞き直してくれる。そういう仕組みだ。
データ量が増えたことで可能になった「もしかして」の機能が、音声認識技術にも応用されている。ほんの数年前まで、ほとんど使いモノにならなかった音声認識技術がこのところ急に性能を上げているのは、マイクの精度が上がったからではない。利用者が増えたからだ。スマホに向かって音声で入力する人が増えてきて、少々なまりがあっても、アクセントがおかしくても、過去データの中から同様のなまり、アクセントの音声に関する結果を探し出し、それと照らし合わせて「もしかして」と、推測できるようになってきたからだ。
「もしかして相手はこう言おうとしているのではないだろうか」。そう推測することが、人間同士のコミュニケーションの成立の条件である。大量のデータを集めることで、人間の脳のような働きがコンピューターでも可能になってきたわけだ。
そこで大事なのは、大量のデータである。大量の情報である。
FOLLOW US