IT・科学
AIの東大挑戦、解けなかった問題は 「8割の高校生が負ける」教育への警告
■なぜ人工知能は東大に合格できないのか?(下)
ロボット(AI)が東大に挑む「東ロボくん」プロジェクトに一区切りがついた。挑戦して分かったのは、ある種の問題には対応できても、読み解けない問題が多く残るというAIの弱点だ。有名私大に合格できるレベルには達しても、東大に届く見通しは立たないという。
プロジェクトを率いた新井紀子教授が明かすのは、近未来への意外な不安である。まことしやかに語られるシンギュラリティ(AIが人間の能力を超える技術的特異点)への到達には懐疑的であり、また人間が担う労働は二極化が起きると予測する。
国立情報学研究所教授・新井紀子氏
***
私たちは東ロボをやめたわけではなく、選択と集中をします。東ロボくんでは、現在可能な取り組みは右から左まで、論理も、データで力任せにニューラルネットワークする方法も、ひと通り試しました。その結果わかったのは、AIにはできることとできないことがあるということ。AIには難しいと思われた問題は、難しいまま残りました。
■言葉の意味がわからない
たとえば人間は会話するとき、どのようにして「こう言ったら適切だ」と思うのか、という問題。古文や漢文についても、どうして人間には和歌の意味がわかるのか、といったことは謎のまま残りました。最先端の方法を全部並べても、できないものはできないという感触を得たので、現在の、脳の神経回路の仕組みを摸したニューラルネットワークの先にシンギュラリティは来ないと思った。東ロボくんを5年間使い、そのことを国民に示したのです。
東ロボくんは2016年のセンター模試で、世界史は偏差値66を記録しました。東大2次型の記述模試でも15年は54、16年も52と、平均を上回りました。教科書とウィキペディアを読み込ませた結果です。ビッグデータではなく、教科書的に正しい情報のみを覚え込ませたのです。
数学は16年の東大2次型模試で偏差値76。辞書を作り、それを使って問題文の単語を分解し、機械にも読める言葉に変換させました。一つひとつ並列に読みを考え、意味がありそうな読みが見つかったら計算して解答を出す。「空間内」「直線」「共有点」などの単語を辞書に5万語ほど入れましたが、新しい問題に取り組むと知らない単語が2割はある。それでも出された答えは合っていました。
しかし、具体的な状況描写に沿って解くのはダメで、ショックだったのは「うまく選ぶ」という言い方。試験では「平面上にうまく点を選ぶと、その点からA、B、Cの各点までの距離を最小にすることができる」のように出てきます。「A、B、Cの各点までの距離を最小にするような点がある」と書いてあれば東ロボくんは解けますが、「うまく選ぶ」って何なのかわかりませんでした。
東ロボくんにとって模試の問題を解くことはロングテールとの戦いです。ロングテールとは、めったにない事例が全体のかなりの割合を占めることを長い尾にたとえた言い方。東ロボくんには問題はいつも意味不明の事柄の集積なのです。
世界史は自立語だけを考えさせ、文章の末尾も「~である」「~だ」になると思わせればいい。クレオパトラの鼻がもう少し低ければどうなったか、といった仮定の話など絶対に出題されないので、事実が羅列された問題文からキーワードを抽出し、ウィキペディアや教科書を同時に検索して、確からしい文章を書ければいい。それにくらべると数学は大変でしたが、裏返せば、人間にはそれほど柔軟性があるのです。
いずれにせよ、問題を解く際のアプローチが人間とAIとでは違う。だれでもこれくらいは知っている、という常識がAIにはないからで、センター模試の物理にも苦労しました。「車からボールを後ろ向きに放ったら」と書かれると、だれが車に乗って、ボールを放るのはだれか、後ろはどっちだ、と混乱してしまう。数学のときのように辞書を作るなら、辞書を作る人が要ります。道具を生み出し、利用し、チューンアップする人が必要なのです。
ところが、今の中学生は文章の意味が理解できないAIよりもさらに文章が読めていません。このままでは私が予想したように、AIを使いこなせる人がいなくなりかねません。
■中高生が文章を読めない
「AIの時代は人手不足には万々歳だ」と、みな言いますが、私は例の本(※新井教授が2010年に上梓した『コンピュータが仕事を奪う』)に「マッチングの問題がある」と書きました。少子化で子供が減った分の労働力をAIが補い、生産性を向上させることができれば日本経済にとっても朗報です。しかし、現実には、低コストのAIにできるレベルのことしかできない子供が増えてきています。
私は問題文の意味が理解できないAIに、どうして8割もの高校生が負けたのか、もしかしたら中高生もAI同様に、教科書や問題文が読めていないのではないか、と疑問を抱き、全国1万5000人の中高生を対象に調査を始めました。
その結果、今の中高生は教科書がまるで読めていないことがわかった。パターン認識を大量にさせ、これを見たらこう返せ、という教育を受けている彼らでも、意味がわかっていないとよくは解けません。このままではAIの前でにっちもさっちもいかなくなります。
掛け算やかなの漢字変換など、統計に基づいた判断はできても、ウィキペディアを読んで意味がわからない、ということではまずい。格差が広がるばかりか、失業問題も人手不足も解消されなくなります。「人が減ってもAIがある。産業革命のときも結局、だれも困らなかった」と言う人もいますが、事実として子供は文章が読めず、AIに劣る問題解決しかできない。これではAIを使いこなすどころか、むしろAIに使われてしまいます。
教科書がまるで読めない子に、教科書の内容を理解できているかどうかのテストをしても、鉛筆を転がして解答するのと同じレベルでしか正答できないはずですが、現実に今、そのレベルの子が中学生の2~3割を占めています。子供は減っているのにこの状況なのは、いかにもまずい。
***
たとえば新井教授の調査では、中高生に、
「Alexは男性にも女性にも使われる名前で、女性の名Alexandraの愛称であるが、男性の名Alexanderの愛称でもある」
という文章を読ませ、
「Alexandra の愛称は( )である」
という文中の空欄を、
「①Alex、②Alexander、③男性、④女性」
の4語から選ばせたが、正解できたのは中学生の38%、高校生の67%にすぎなかった。
***
子供たちがここまで文章を読めていない現状を、今まで政府は把握していなかったのだと思います。ゆとり教育を改めて指導内容を濃くしても、教科書が読めないのでは無理があります。それが東ロボの挑戦につづいて行った読解力テストでわかったうえ、さすがにAIだったらそれくらいは読める、という話になってしまいました。
どうにかしなければいけませんが、私一人の力では無理で、このままではまずいという世論の醸成が不可欠です。今、世の中は英語教育とプログラミング教育を進めようという流れですが、日本語も読めないのに英語を学ぶ意味がありますか。日本語も読めないのにプログラミングができますか。そのことをまだ、だれも考えていません。
AIを使いこなせる人が決定的に不足する――。私が2010年に予想した事態を現実にしないことが、東ロボくんの性能を上げるよりも重要だと思います。
特別読物「なぜ人工知能は東大に合格できないのか――新井紀子(国立情報学研究所教授)」より
新井紀子(あらいのりこ)
1962年生まれ。一橋大学法学部卒、米・イリノイ大学大学院数学科修了。広島市立大学助手等を経て、2006年から現職。専門は数理論理学。主な著書に『コンピュータが仕事を奪う』(日本経済新聞出版社)。