AI研究者が問う ロボットは文章を読めない では子どもたちは「読めて」いるのか?

AI時代に人間が生き残る術を考え続けてきた新井紀子・国立情報学研究所教授

「ロボットは東大に入れるか」プロジェクトでぶつかった「ある疑問」

国立情報学研究所(NII)の社会共有知研究センター。

「ロボットは東大に入れるか(東ロボ)」プロジェクトで知られる人工知能(AI)の研究チームが、子どもたちの読解力テストに着手した。

なぜ、AI研究者が「読解力」に関心をもつのか。

そこには、AIの限界を探る研究の過程でぶつかった、ある疑問が関係している。

センター長の数学者・新井紀子さんに話を聞いた。

今日(11月14日)の「東ロボ 2016成果報告会」で冒頭あいさつする新井紀子教授。東ロボプロジェクトは2011年にスタートした
今日(11月14日)の「東ロボ 2016成果報告会」で冒頭あいさつする新井紀子教授。東ロボプロジェクトは2011年にスタートした

AIは国語が苦手

――なぜ、AI研究者が「読解力」に関心を?

東ロボは、問題を解き、正解も出すが、読んで理解しているわけではない。

現段階のAIにとって、文章の意味を理解することは、不可能に近い。

そうすると、特に難しいのが国語と英語だ。

国語では、2016年のセンター試験模試(進研模試 総合学力マーク模試・6月)では、200点中96点しかとれなかった。

偏差値は49.7。

5科目8教科全体の偏差値が57.1だったことを踏まえると、かなり低く、

これらの教科は苦手だということがはっきりした。

ロボットは東大に入れるか2016 結果概況
ロボットは東大に入れるか2016 結果概況

ちゃんと読めば、わかるのか?

しかし同時に、疑問に思ったことがある。

「文章の意味を理解できない東ロボよりも、得点の低い高校生がいるのは、どういうことだ?」

「この高校生たちは、文章の意味を理解できているのだろうか?」

「義務教育で、教科書の文章を読める力は本当についているのだろうか?」

私たちは、子どもたちが「読める」ことを大前提に話してしまう。

だから「わからない」と言う子に対して、大人たちは「ちゃんと読め」と言う。

「ちゃんと読めばわかるはず」という前提、それだけの読解力は備わっているという前提がある。

しかし、そもそも「読めて」いないのだとしたら?

どれだけ「ちゃんと」読んでもわからない。

社会が得意、算数が苦手という以前に、読めているかどうかを見る必要があるのではないか、と思うに至った。

関ヶ原の戦いは何年?の解き方

――そもそもAIが「読める」とか「読めない」というのは、どういうことですか。

AIを含むコンピュータが得意なのは、情報とパターンで問題解決すること。

たとえば「徳川家康は(    )年の関ヶ原の戦いで、石田三成らの西軍を破った」の(    )に何が入るか。

答えは1600年。

コンピュータは、この答えを膨大な情報を瞬時に検索して答えを出す。

教科書、Wikipedia、百科事典など、デジタル化された情報すべてにアクセスし、検索をかけられる。

コンピュータは「戦う」とか「破る」という事態が、どのような事態なのかはわからない。

その言葉がリアルな世界で何を表すのかはわからない

それでも、字も追えるし、検索もかけられ、それによって正解にたどりつく。

「読めない」が解ける、というのはそういうことだ。

コンピュータがイヌとネコを見分ける仕組みを説明する新井紀子教授。コンピュータは現実のイヌやネコを知っているわけではないが、見分けられる
コンピュータがイヌとネコを見分ける仕組みを説明する新井紀子教授。コンピュータは現実のイヌやネコを知っているわけではないが、見分けられる

検索と確率だけの世界

さっきの問題文は、コンピュータにとって、意味不明の記号の羅列にすぎない。

人間にとっての「●△※×★÷◎◆▼□+」と同じだ。

でも、膨大な検索をかけると「●△※」と「◆▼□」がセットで出てくることの多いことがわかる。

「●△※」と「◆▼□」は強い結びつきがありそうだと推論する。

これが確率だ。

そこで、選択肢の中から「◆▼□」を選ぶ。

これが「1600」だ。

膨大な検索を通じて、確率的にありそうなことを選び出す。

これがAIのやっている作業だ。

本や服を買うと「これも好きなんじゃないですか?」と瞬時に推奨される。

今や一般化したネット上のサービスも、すべてこの仕組みで動いている。

東ロボが問題を解く画面。ひたすら記号が並ぶ
東ロボが問題を解く画面。ひたすら記号が並ぶ

「10台を3日」と「10人に3個ずつ」の違い

数学でも、高校以上の抽象的な問題は比較的よく解ける。

一方で、

「一日10台の自動車を生産する工場が3日間操業した。さて、自動車は何台できたでしょう?」

という問題には非常に苦労する。

この問題が、

「10人が3個ずつりんごをもらった。りんごは全部でいくつ必要か」

という問題だったら、解ける可能性はある。

違いは何か。

2つ目の問題には、掛け算のキーワードになる「ずつ」という言葉が出てくる。

キーワードとして「10、3、ずつ」をうまく選ぶような機械学習ができれば、

たぶん「10×3=30」が答えだろうということになる。

他方、その前の文にはそのようなキーワードが出てこない。

「10、3」しかキーワードが選べない場合、足し算、引き算、掛け算、割り算のどれをすればよいか、困る

問題文が読めないとはそういうことだ。

子どもたちを見ていると…

ところが、子どもたちを観察していると、

キーワードとパターンで解いている子、読んでいる子が意外にいる。

そこに不安が生じてきた。

キーワードを探す検索、

パターンを覚えて「こういう場合はこうだろう」と確率的に解くやり方では、

莫大な処理速度をもつAIに、いずれ追い越される。

仮にそれで正解を得たとしても、そこで培われた力は、いずれAIに取って代わられていく。

そこに、私たちの危機感がある。

だから、調査することにした。

どれくらい読めているのか、と。

「子どもたちはどれくらい読めているのか。本当に危機感がある」
「子どもたちはどれくらい読めているのか。本当に危機感がある」

AIの得意分野と不得意分野で

――どうやって調べるのですか?

「リーディングスキルテスト」(読解力テスト)を行う。

詳しくはプレスリリース資料(「リーディングスキルテストで測る読解力とは」)を見てもらいたいが、

簡単に言うと、

小中学校の教科書に出ている知識だけを使い、

6分野のテストを行って、読解力を見る。

AIが比較的得意な3つの分野と、不得意な3つの分野だ。

AIが不得意なのは「推論」「イメージ」「具体例」の3分野。

この3つについては、少なくとも今のところ、どうやればAIがこれらの問題を十分に解けるようになるのか、その方法論がさっぱりわからない。

リーディングスキルテストの受験を呼びかけるリーフレット
リーディングスキルテストの受験を呼びかけるリーフレット

注目を集め始めたリーディングスキルテスト

現在、主に小中学生を対象にすでに予備調査を終え、

1万人を対象にした本格的な調査に着手している。

文科省も、私たちの取組に刺激を受けて、今年度中に「高等学校基礎学力テスト(仮称)」を導入する検討を始めた。

一般企業の中にも、就活における適性検査に、このテストを採用しようとする動きが表れ始めている。

急速に普及する可能性がある。

成果報告会には多くのメディアや行政・企業関係者が集まっていた
成果報告会には多くのメディアや行政・企業関係者が集まっていた

予備調査の結果は…

――予備調査の結果はどうですか?

本調査の結果が出ないかぎり、確定的なことは言えないが、

これまでのところ、テストを受験した公立中学校生340人のうち、

約5割が、教科書の内容を読み取れておらず、

約2割は、基礎的な読解もできていない

ことが明らかになってしまった。

そして、偏差値の高い学校の生徒ほど、リーディングスキルテストの成績もよい。

「読める」子が偏差値の高い学校に入っている可能性がある。

どうやって「読める」ようになるのか、その原因はまだわからない。

その原因を探求して、対策を立てるのが、この調査の目的だ。

AIが得意な「係り受け関係認識」を聞く問題の解答例。AIの正答率は9割に達しつつある
AIが得意な「係り受け関係認識」を聞く問題の解答例。AIの正答率は9割に達しつつある

将来、大変なことになりかねない

それほど複雑な問題でなければ、受験テクニック的には、キーワードを拾い、パターンを覚える解き方のほうが効率がいいかもしれない。

でも、AIと同じ解き方では、AIには太刀打ちできない。

それでは、これからの時代は乗り切れない。

早く正解にたどりつく力は大事だが、

それが「読めない」子どもたちをそのままにしているとしたら、将来、大変なことになりかねない

――大変なこととは?

すでによく知られているように、AIによって、これまで人間がやってきた少なからぬ仕事が置き換えられる可能性がある野村総研調査)。

私が2010年に『コンピュータが仕事を奪う』(日本経済新聞社)を出版したときには、誰もまともに受け取ってくれず、本はSFの棚に並べられたものだが、

今ではかなりリアリティのある話として受け止められている。

成果報告会には、将棋の「電王戦」にも機器を提供しているデンソーの解答代筆ロボットが登場
成果報告会には、将棋の「電王戦」にも機器を提供しているデンソーの解答代筆ロボットが登場

読めなければ転職もできない

置き換えられるのは、

従来ホワイトカラーがやってきた、手順が決まっていて、覚えることのできる仕事だ。

経済学者の中には「仕事が消えても他の仕事が生まれるので、心配ない。産業革命のときもそうだった」と言う人もいるが、

現代は、何をやるにしても一定程度の知識が前提となる知識重視社会(知識基盤社会)だ。

たとえば、ある分野で失業した人が他の分野に移ろうとしたとき、

一定の職業訓練が必要で、それには初めて見る文章、自分の知らない分野のことが書いてある文章を「読める」必要がある

しかし、もしそれを読む力そのものが備わっていなかったら?

失業は長期化せざるを得ない。

パソコンが使えずに申請書を書けないといったデジタルデバイド(格差)の問題があるが、

文章が読めないので、新しい職業に移行できないという事態が、より大規模に起こる可能性がある。

楽観できない。

「なぜ高校生は、意味を理解しないAIに敗れたか?」
「なぜ高校生は、意味を理解しないAIに敗れたか?」

「読める」ようにするのが公教育

――このプロジェクトを通じて、新井さんが目指すものは何ですか。

なぜ「読めない」のか、

「読める」ようになるためには何が必要なのか、

原因を調べ、対策を立てたい。

公教育とは、国民全員に基礎的学力を保障するもののはずだ。

たとえ入学前に差がついてしまっていたとしても、差がなくなるようにするのが、公教育の責務だ。

中学を卒業するまでには、全員が教科書レベルの文章を「読める」ようにしたい。

リーディングスキルテスト(RST)の目指すもの
リーディングスキルテスト(RST)の目指すもの

貧困家庭の子であっても

貧困家庭の子は、相対的に学力の低いことがわかっている。

しかし、貧困の連鎖、ワーキングプアの再生産は断ち切らなければならない。

貧困状態にある子であっても、AI時代を生き抜く最低条件を整備する。

そのためには、誰もが通過する公教育で「読める」ようにしたい。

その意味では、これは貧困対策でもある

書いてある内容が読めずに、必要な援助を申請できないなどということがあってはならない。

それを実現させるまで、このプロジェクトは終わらない。

あなたは「読めて」いるか?

さて、あなたは、次の問題に答えられるだろうか?

【問題1】が「イメージ」、【問題2】が「具体例」、

いずれも、AIが解けない問題だ。

【問題1】

画像

【問題2】

画像

どうだろう?

答えは【問題1】が2番と3番、【問題2】が2番と4番だ。

そして

このインタビューがきっかけで、私もこのプロジェクトの共同研究者になった。

目的は、読解力と貧困の関係を調査・分析すること。

まず、協力してくれる自治体を募り、調査するところから始めたい。

新井さんは、今日の成果報告会でこう言った。

国民の少なからぬ人たちが、

矛盾していたり、センセーショナルなだけで中身のない発言の意味を吟味し、

その矛盾を見抜いたり、実現可能性や妥当性を評価できる読解力を身につけていなかったら、

世の中は大変なことになってしまうのではないか、と。

そして、力を込めて、こう締めくくった。

資本主義社会が不可避に生む

格差と不平等は、

リテラシーをもつ市民による民主主義で

乗り越えられるはずだった。

あなたは、今、彼女がこのように言う意味を「読める」だろうか?

画像