本連載の原稿は、2017年の2月から4月にかけて書いたものです。その間、私とポナンザ、そしてコンピュータ将棋の世界にとって、大きな出来事が2つありました。
1つは、将棋で初めて実用レベルのディープラーニングに成功したことです。第10回で、「ポナンザにはディープラーニングは使われていない」と言いましたが、連載を書く途中で事情が変わったことになります。
囲碁とは異なり、将棋やチェス系のゲームではディープラーニングがうまくいかないのではないか、と私が考えていたのには理由があります。将棋やチェスは、囲碁より合法手(ルール上可能な手)がダイナミックに変化するからです。
この問題はかなり深刻です。囲碁は言ってしまえば、空白の場所に打てばほぼ間違いなく合法手です。しかし将棋やチェスでは、直前まで合法手だった手がそうでなくなるということが、ごく普通にあります。さらに王手がかかれば、指せる手は大きく変化します。
実際、チェスでディープラーニングを試したという論文がいくつかありましたが、あまりうまくいってないようでした。私も同じく、何年もディープラーニングを将棋に使うことを試みましたが、なかなかうまくいきませんでした。
それがなぜ実現できたか。データ量を増やして、最新のディープラーニングの知見を入れていったら自然にできるようになった、というのが1つの理由です。加えて、とくに凝ったことをせずに、ディープラーニングにすべてを任せるようにしたことがポイントでした。
合法手をどうやってディープラーニングに教えればよいのか、ずっと苦心していました。しかしそれはいらぬ苦労でした。私がディープラーニングにしてあげたほうがいいと思ったことが、ディープラーニングにとってはむしろ邪魔だったのです。
ディープラーニングは、最もよい手を教えてあげれば、自然と、どの手が合法手か非合法手かの区別もつくようになったのです。私はディープラーニングに、駒の動かし方はもちろん、王手のことも、二歩(にふ)というルールのことも何ひとつ明示的には教えていません。ただ、この局面で最もよいのはこの手だと、ひたすら教え続けたのです。
その結果、恐るべきことに、いつの間にかディープラーニングは将棋のルールを会得していたのです。しかし、これはある意味当然かもしれません。人間も、ある程度将棋に慣れれば、合法手なんて考えませんものね。「いま指そうとしている手がルールどおりなのか?」とわざわざ考えるのは、ごく初心者のうちだけなのです。
ポナンザは今後、アルファ碁と同じようなルートをたどって強くなる可能性が高いでしょう。具体的には、アルファ碁がディープラーニングと既存のモンテカルロ法との組み合わせだったように、ポナンザも、ディープラーニングと既存の手法の組み合わせにチャレンジすることになります。
そのポテンシャルがどこまであるのか、現時点ではまだまったくわかりません。しかし私は、ディープラーニングの将来性に確信を持っています。
わざと歩を渡して防御を固める
本連載の執筆中に起きた2つ目の出来事は、2017年4月1日におこなわれた第2期電王戦において、現役の「名人」にポナンザが勝利したことです。
電王戦は、かつてのプロ棋士と将棋プログラムによる5対5の団体戦から、互いにトーナメントを勝ち抜いたプロ棋士と将棋プログラムの頂上決戦に形を変えました。
現在、将棋界にある7つのタイトルのうち、最も長い歴史を持ち、最高位とされるタイトルが「名人」です。この称号は徳川家康が最初に授けたとされており、今回は佐藤天彦名人が対局者になったことから、第1局は徳川家康がまつられる日光東照宮が会場となりました。
ポナンザの対局には、当然私も立ち会います。佐藤名人と私はともに和装でのぞみ、ついに世紀の一戦が開始されました。
先手ポナンザの初手は3八金。プロ棋士による公式戦では、ほぼ指されたことのない手です(公式戦の初手は、2六歩か7六歩が多いです)。対局の様子はニコニコ生放送でライブ中継されており、この始まり方には多くの人が驚いたようです。
しかし「将棋の定跡はもっと自由度が高いものだ」、とポナンザは言っているように思います。この手に違和感を持つ人は、既存の将棋の物語にとらわれ過ぎているかもしれません。
結果は71手にてポナンザの勝ち。プロ同士の対局の多くは100手を超えるので、かなり短時間で勝敗が決したことになります。実際、内容的にもポナンザの完勝と言えるものでした。
コンピュータが初めてタイトルホルダーである棋士に勝利したこの日は、コンピュータ将棋の世界にとって記念すべきものになりましたが、同時に改めて、人間と人工知能の違いを認識させられた日ともなりました。
本連載で紹介してきた人工知能(ポナンザ)の特徴と、世界に意味を見つけ物語を紡いで考えていく人間の思考法の限界が明確に表れたのです。
私は対局の最中、ポナンザに佐藤名人の手を入力しながら、経過を追っていました。ポナンザは、1手ごとに、どちらがどれだけ有利になったかを評価し、数値として出してきます。その数値がとくに大きく傾いたのが、53手目・ポナンザによる7四歩でした(図5-1)。
図5-1 第二期電王戦第一局1
これは、理外の理と言える手でした。このとき、攻めている佐藤名人には持ち駒がありません。このような場合、攻めてくる相手には駒を渡さずに局面を進めるのが将棋のセオリーです。しかし、ポナンザはわざわざ歩を渡したのです。
これは、佐藤名人としては銀で取る一手です(図5-2)。このとき、セオリーどおりであれば、ポナンザが不利になるはずですが、図5-2を見ると、むしろ有利になっているのです。
図5-2 第二期電王戦第一局(2)
相手に駒を渡して防御を成立させる——意味と物語で考える人間には、決して指せない手だったと言ってよいでしょう。あとから振り返っても、人間にとってこの手はよくわからないけれど「なぜかうまくいった手」としか言えないのです。
おそらく、人間のパターン認識ではよい形にしか見えなくても、100回に1回くらい、人間には認識できない悪い形というものがあるのでしょう。ポナンザはその評価を誤らず、確実に突いてくるのです。
別の言い方をすれば、意味が見つけにくく、今まで人間が連綿と作り上げてきた将棋の物語から外れた手には、人間は相当の努力をしなければ対応できないといえるかもしれません。
意味と物語から自由なポナンザは、人間の限界を超えて、将棋がもっと奥深いものであることを教えてくれます。これまで人間が楽しんでいたのは、深さが何キロもある将棋という海の、ほんの浅瀬にしかすぎなかったのです。
対局後の雰囲気も、かつてのお葬式のようなものとは完全に変わりました。佐藤名人は対局を振り返りながら、事前に提出されていたポナンザとの練習の対局でもほとんど勝てなかったことを率直に明かし、同時に5月20日におこなわれる第2局への決意を新たにされていました。将棋界は、完全に人工知能という存在を受け入れたのです。
新刊のお知らせ
この連載が本になります!
『人工知能はどのようにして「名人」を超えたのか?』
山本一成著 定価:1,500円+税 発行年月:2017年5月 ダイヤモンド社
多くのメディアで注目浴びる開発者が、
10年間AIを作りながら考えた、 知能と知性、コンピュータと人間のこと。
◇「黒魔術化」する人工知能
◇黒魔術の1つ、「怠惰な並列化」とは
◇ディープラーニングは 知能の大統一理論になれるか?
◇サイコロにも知能がある!?
◇囲碁は画像だった!
◇知能の本質も画像なのか?
◇科学が宗教になる瞬間を見た
◇研究者は「人工知能の性能が上がった理由」を説明できない
◇人類はこれから、プロ棋士と同じ経験をする
人工知能は今、プログラマの手を離れ、 既存の科学の範疇を超え、 天才が残した棋譜も必要とせず、 さらには人間そのものからも卒業しようとしています。 その物語を、できる限りやさしく語りました。
アマゾンリンクはこちら