Hatena::ブログ(Diary)

shi3zの長文日記 RSSフィード Twitter

2016-10-11

AIが高度に発達することが確定した今、高校生が英語を学ぶ意味はあるのか? 05:00

 AIの発達が近年著しいことはこのブログの読者諸氏なら百も承知だと思います。

 

 先日、とある教育者の方からこんな質問をされました。

 

 

 「人工知能が完璧に自動翻訳をできるようになるまで、あと何年くらいかかるでしょうか?」


 僕は直感的に答えました。


 「まあまだまだ、あと五年か十年はかかるでしょうね」


 すると彼女は不安そうにこう聞き返した。


 「遅くてもあと十年で自動翻訳の方が人間よりも高性能になってしまうんですか?」


 「まあ少なくとも今のGoogle翻訳とは比べ物にならないレベルに行くでしょうね」


 「単なる機械的な直訳だけでなく意訳もできるようになるでしょうか」


 「意訳もできるようになると考えられていますね」


 実際、既に意訳の研究は始まっています。


 Google翻訳を始めとするこれまでの機械翻訳では、原則として一文を一文に変換する、要は直訳しかできませんでした。しかし言語によっては必ずしも直訳が適切とは言えない場合が多々あります。特に長い文章になるとそうです。僕が何度も訳したケネディ大統領の演説の中の一文を例にしてみましょう。


We choose to go to the Moon! ... We choose to go to the Moon in this decade and do the other things, not because they are easy, but because they are hard; because that goal will serve to organize and measure the best of our energies and skills, because that challenge is one that we are willing to accept, one we are unwilling to postpone, and one we intend to win ...


 これは名文だが、どう訳せばいいのかというと実はかなり難しい。一文がむちゃくちゃ長いのです。

 たとえばこの中で繰り返し出てくる「We choose to go to the Moon!」ですらちゃんと訳すのは難しいのです。


 Google翻訳で全文を訳すとこんな感じになります。


私たちは月に行くことを選択します! ...我々は、彼らが容易ではないので、この10年で月に行くと、他の物事を行うことを選択し、彼らは難しいからです。その挑戦は、私たちが受け入れても構わないと思っているものですので、その目標は、私たちのエネルギーやスキルの最高のを整理し、測定するために役立つので、一つは我々が延期に消極的であり、一つは我々が勝利するつもり


 言うまでもなくこの訳はガタガタです。元の演説のドライブ感がどこにもなくなってしまいます。


 ケネディ大統領の演説にこんな字幕がついたら台無しになってしまうと誰でも思うでしょう。だから翻訳は難しいのです。


 そしてこの訳文を注意深く見ると、単語単位で対応する単語やイディオムがあることに気づきます。これが今のところ自然言語処理による機械翻訳の限界です。

 これをどう訳すべきなのか。

 人間の訳者ならもう少しドライブ感を残すことができます。


我々は月に行くと決めた。我々が今後10年以内に月に行くと決め、必要なあらゆることを開始した。それが決して容易だからではなく、むしろ困難だからであり、なぜならこの目標は、我々の持つすべての情熱や能力を結集した実力を知ることができ、さらにはこの挑戦は我々が後回しにせず今すぐ挑むことを望み、最終的には勝利を掴むつもりだからだ


 やはり難しいのでいろいろな人がいろいろな訳を当てています。

 ぜんぶの要素を盛り込もうとするとどうしても、「organize and measure the best of our energies and skills,」をどう訳すか悩むことになります。これは本当は原文ママのほうが美しいのですが、言葉の流れを優先して、measure(測る)をとってしまうというのも一つの手です。が、演説のように重要なものの要素を削ると原理主義者にツッコまれることになるので何らかの形で残さないとなりません。ここでは「我々の持つすべての情熱や能力を結集した実力を知る」としました。


 ドライブ感を残そうとすると多少のウソが入ります。たとえばbecauseが繰り返し出て来るところは、毎回「なぜならば」と訳すとヘンになってしまうので、最後のbeauseは「さらには」と訳しています。ドライブ感を壊さないため、意図的に異なる訳をして文章全体の意味を優先して訳しているのです。これを意訳と言います。


 また、文章も途中で分けています。


 意訳はやりすぎると二次創作と言っていいくらい意味が変わってしまうので注意深くやらなければなりませんが、意訳しないとどうしても読めない文章というのは存在するのです。


 たまに意訳しすぎて怒られがちな人として戸田奈津子先生が居ますが、翻訳というのはそもそも難しい仕事なので、全力で文脈や文章の隠された意味を知る必要があります。が、多くの場合、それは難しすぎるのです。原作モノの場合、原作まですべて読んで理解している熱烈なファンに比べて、数をこなさなければならない戸田先生の理解が浅いのはある意味当然といえます。これは戸田先生のミスというよりも熱烈なファンがいる原作ものをちゃんと監修できる人を用意できない映画会社のプロデューサーの責任でしょう。


 よく、技術書の場合、翻訳された技術書は翻訳者の能力が低くて間違った訳や不十分な訳になっていることがあります。


 そういうときは仕方がないので原典を当たる必要があります。

 

 そのくらい、翻訳というのは難しいのですが、まあ多くの場合、だいたい意味が会っていればOKというのが人の世の常です。


 ところがたとえば英語→日本語という程度の内容であっても、これだけ人間を悩ませ、文章の奥に隠れた真意を汲み取らなければならないわけで、その上、ある意味で確信犯的にウソを入れないといけないとなると、我らがコンピュータちゃんたちがそんな器用なことができるようになるんかいな、という疑問を持つのはある意味で当然と言えるでしょう。


 しかし人間にできることは当然、コンピュータにもできるようになるだろう、というのが今の最先端のAI研究者たちの考えていることです。


 例えば、ひとつの例として、画像を言葉で説明するAIがあります。

https://i.gyazo.com/49df56d2e57aa805d8600440b295429c.png


 つい数年前まで、こんなことができるかもしれないとは誰も考えていませんでした。

 左が正解で、真ん中と右は多少のミスがありますが、それでもなんとなく意味はあっています。ちょっとしたおじいちゃんならこの程度のミスはやらかしそうです。


 このAIを作るのは非常に簡単です。

https://i.gyazo.com/bdbaad6ffa00b7e159812ac63ede128c.png


 画像と説明文のセットをただひたすら学習させるだけです。

 そんな単純なことだけで、こんなAIが出来てしまうのです。これは控え目に言っても驚異としか言えません。


 そして今のAIには奇妙な性質があります。

 A→Bができるとき、それを逆流させてB→A'もできるのです。


 つまり、画像を言葉にできるとき、言葉を画像に変換することもできます。


https://i.gyazo.com/b33a267196a510f497742e54bdf083e4.png


 まだ精度は低いですが、なんとなく英文から画像がぼんやりと生成されていることがわかると思います。

 最近はもっと過激なこともできるようです。


https://67.media.tumblr.com/8f2a2836f63525608f01f24ab4323f18/tumblr_oeuq3hpHXv1qav3uso1_540.gif


 赤い四角形を入力して、そこに何があるべきかという文章を入力すると、自動的にそれにふさわしい画像が生成されます。


 たとえば、「This bird is completely yellow」と打ち込むと、赤い四角形で示された黒い鳥が黄色い鳥に変わります。


 実装はこちら→GitHub - reedscot/nips2016: Learning What and Where to Draw



 乱暴に言えば、この2つを別の言語で組み合わせると、意訳が出来ます。


https://i.gyazo.com/15bb4b25cbf0c63f456bc3edcdf47008.png



 これは人間の頭のなかで起きていることと似ています。

 人間も、ある英文を読んだときになんなくの情景を頭に思い浮かべます。


 そして頭に浮かんだ情景を別の言語で表現するとき、意訳になります。

 ちなみに「A man is typing keyboard of note PC」をGoogle翻訳にかけると「男は、ノートPCのキーボードをタイプしています」となります。この程度の翻訳でも機械的に文法だけから訳すとヘンでしょう?


 ちなみに英語教育ドップリのお人は、つい「A man is typying "a" keyboard of note PC」のように「aが抜けてる!」とヒステリックに叫びますが、ここではあんまり意味のある話ではありません。日本人の大半が正しい日本語を喋ったり書いたりせず、「食べれる」のようなら抜き言葉、「あり得ないし」のような事実に反する断定、「残念ながら大成功です」のような意味を逆さにした強調、などなど、日本語としてはおかしいけれども意味は通じるという言葉の方が一般的で、英語で書かれた文章も必ずしも常に正しい英語文法になってないことがあります。翻訳ではそういう事態のほうが多く、また難しいのです。口語の場合は特にそうです。重要なのは意味が伝わることです。


 AIで一度画像に変換してから画像を説明させるという方法を使うと意図的なウソをつかなくても、「勘違い」を起こすことで結果的には意味がそれほど変わらないエラーが自然に入ることになります。


 今のAIはよく「勘違い」を起こすので、ウソをわざわざ実装しなくてもいいということになります。

 子供に翻訳を頼むと多少の勘違いでミス(意図しないウソ)をするのと同じです。


 さらにAIには、単体のAIだけが推論するよりも、複数のAIが推論した結果の多数決をとるとより精度の高い推論ができるという性質があり、これはアンサンブル学習とも呼ばれます。


 人間でいえば集合知Wisdom of Crowdsといったところでしょう。


 さらには、各国ごとの言葉を充分学習した(最近流行りの)校閲を目的としたAIを作ることも考えられます。

 原始的な校閲用AIは単純なLSTMでとにかく大量の文章を学習し、「ふつうこういう言葉がきたらこう続くはず」という視点から言葉を修正していきます。


 まあテクニカルなところはともかくとして、重要なのは既に現状の技術でここまで出揃っており、実装する意志のある研究者も組織も存在しているということです。


 自動翻訳がもっと実用的になれば、世界はものすごく広がります。日本人は自分の考えを全世界の言語で発表することができますし、また同時に全世界の言語で書かれた様々な本を読むことが出来ます。


 いずれ世界中の誰とでもメールやチャットで会話することができ、音声でごく自然に諸外国の人とやりとりすることができるようになるでしょう。


 むしろ今の世の中、海外で言葉が通じない最後の世代なのかもしれません。

 僕はその昔、まだ携帯にGPSが付いてなかった頃に自動車でヨーロッパ横断をしたのですが、各国ごとに地図が違ったり、言葉がわからなかったりして、フランスの田舎町で道に迷って、地図を片手に老婆に話しかけると身振り手振りで正しいルートを教えてもらったりしました。


 「そういう混乱が楽しめるのは、もしかしたら今だけかもしれません。

 何年かあとにバルセロナからパリを目指したときは、とっくにGPSがあって、スマートフォンがあって、そういう、紙の地図を見ながら不便さに汗するという楽しみがなくなってしまいましたよ」


 AIによって意訳が可能になること、そして世界中の知識が接続されること。

 そんなことをぺらぺらと彼女に説明しました。


 「だとすると、私達は子どもたちに英語を教えるよりも、もっと教えておくべきことがあるのではないでしょうか。今の子供達の10年後を考えると、機械に代替されてしまうスキルである英語教育よりももっとやるべきことがあるのでは」


 「人工知能が発展した時代に、人間に求められるスキルは何かということですね。それならちょうど、今の人工知能の状況が簡単にオーバービューできる本を書きましたので差し上げますよ。僕は人工知能を勉強するのは、早ければ早いほうがいいと思うんですよね。なにしろそれはきっと、いずれスマートフォンよりも身近になり、コンピュータよりも我々の生活に深く関わってくるだろうからです」


 「そんな予感がしてるんですよ。今度もっと色々教えてください」


 ということで、とある教育者・・・品川女子学院の漆志穂子校長先生と僕が人工知能と教育について語り合うトークイベントを企画しました。


http://peatix.com.new.s3.amazonaws.com/event/205294/cover-J53PjOy9aT0kkgof2rmWKhksaYL4WEMi.jpeg

「人工知能は教育をどう変えるか?」品川女子学院 漆校長×清水亮 -『よくわかる人工知能』発売記念セミナー | Peatix

http://peatix.com/event/205294

 

 新刊付き2500円、だけどAmazonで予約しておいたり本を購入した方は500円でご入場いただけます。