ついに囲碁の神様が降臨した?
加藤貞顕(以下、加藤) さて、三連敗を喫して、イ・セドルさん自身も「こんな姿を見せてしまい申し訳ない」と弱気になって迎えた第4局ですが……。
大橋拓文(以下、大橋) 第3局と第4局は連日でおこなわれたんですよね。イ・セドルさんがどんなふうに気持ちを立て直したのか、ぼくには想像もつきません。
左:山本一成さん、右:大橋拓文六段
山本一成(以下、山本) いやあ、この状況でよくしっかり打ったよね。
大橋 第4局の序盤は11手まで第2局とまったく同じ展開になったんです。見ている時、「これはついに、囲碁の神が降臨したのか!」と思いました(笑)。
山本 最初から最後まで読み切って、1手も間違えない囲碁の神様? そんなわけないですよ(笑)。
大橋 山本さんはニコニコ生放送の解説の時も、「アルファ碁は人間よりも強いかもしれないけど、囲碁の神よりはだいぶ弱い」って言ってたよね。でも、碁打ちはみんな恐怖してたよ(笑)。これはついにアルファ碁が神となって最善の布石(序盤)を打ってきたんだ、って。そして、12手目にイ・セドルさんが第2局とは違う手を打った。それも、前例にない手。
白12手目
加藤 このセドルさんの手って定石から外れてますけど、つまり、ちょっと損な手ってことになるんですか?
大橋 ある部分では損に見えるんですけど、違う部分で価値が大きい手なんですよね。広くカバーできるというか。
山本 広くカバーできることは、「薄い」とも捉えられるじゃない? 相手が突破しやすくなってしまう。そのあたりの正確なトレードオフがわからないんだよなあ。
大橋 まあ、広けりゃいいというものでもないね。その微妙な感覚は、棋士で全員違うと思います。その感覚で、より正確に形勢判断ができる人ほど強いんですよね。で、そのあと何手かアルファ碁が打った手は、自分の第一感とは違ったんだけど、「ここを取るほうが大きいと判断したんだな、アルファ碁先生は」と思いました。
山本 アルファ碁を信じすぎでしょう。そんなにあがめる必要ないよ(笑)。
大橋 いやいや(笑)。でもね、みんなそれくらい囲碁というゲームをわかってなかったんだよ。プロでも。
山本 たしかに、囲碁の「攻略されてなさ」は、将棋の比ではない。それは、両方のプログラムを開発してみて思う。
大橋 アルファ碁は本当に布石(序盤)がうまいんです。イ・セドルさんが最初からこんなに時間を使うなんて。彼が相手よりも時間を使っている状況って、世界戦でもまれなんですよ。セドルさんって、普段は相手が必ずどこかで間違うと思いながら碁を打っているんだそうです。つまり、最善手を打とうとするよりも、間違ったところを見逃さず、そこをとがめていくことで勝負に勝ってきた。セドルさんは、相手の考えていることを察知する能力も高いんです。それはもう、動物的なほどに。相手の考えていることを察知して、意表をつく手を打つ。それでみんな時間を使わされてしまう。
山本 それ、すごく強いってことだよね。
大橋 だから、イ・セドルさんは強いんだって!(笑)
山本 いや、時間は不利になるとやっぱり使っちゃうから。相手より強いから時間を使わないんだ。
大橋 そうだね。今回セドルさんは、その方法が通じない相手と対局して、初めて1手目から最善手を考えなければいけない状況に追い込まれたんだと思う。
加藤 相手との関係性において強い棋士っていますよね。将棋の世界だと大山名人とかが代表で、「勝負に強い棋士」って言い方をしますけど、そういうタイプはコンピュータとは相性が悪いかもしれませんね。人間と違って、相手は動揺とかしないから。
コンピュータを混乱させる妙手で、形勢が逆転した
加藤 ところで、アルファ碁って、広いスペースがあっても相手の石にツケて(くっつけて)打ったりしますよね。こういう打ち方って、通常、あまりよくないと言われてませんか?
大橋 そうですね。普通は形を決めないほうがいいんですよ。人間はいろいろな可能性を残して、程よい距離をとっておこうと考えるんです。Aから攻める手とBから攻める手、どちらの可能性も残す手を打つ。ところが、アルファ碁はその先の想定図が見えていて、そこまでいけば70%の確率で勝つ、とかわかってるから、それに向かって形をつくっていくんですよね。
山本 コンピュータは手の「含み」をわかってないんだよね(笑)。
大橋 いま決めなくてもいいという形を、コンピュータはどんどん決めていくよね。そういうのを、「品がない手だ」と言うプロ棋士もいたけど。
加藤 品がないって、人間っぽい評価ですよね(笑)。
山本 それって、コンピュータにとってはどうでもいいことなんですよね。将棋でもコンピュータは、王様を囲うときに、他の囲い方の可能性をなくす順番で指していっちゃうんですよ。たとえば美濃囲いも穴熊もありうる局面で、すぐに香車を上がって穴熊に決め打ちしてしまったりする。人間は含みがなくなるので、それをやりません。コンピュータとしては、最終的に同じ形になればいいでしょって感じだけど、やっぱりほかの囲い方の可能性を消してしまうのは、損だと思うな。
大橋 で、このあともセドルさんにとってはつらい状況が続きます。全体的に白(セドル)の地だと思ってたところが、どんどん黒に侵食されてしまう。で、誰もが切る(相手の石の連絡を断つ)と思ったところで、切らずに辛抱したんですよね。
白52手目
加藤 白52手目か。これはぼくでも「14−十」と切りたくなります。
大橋 みんなそう思ったんです。解説のプロも、これを切らなきゃ囲碁じゃないとまで言っていました。でも、セドルさんは本当にこの局面だけを考えて、切らないほうがいいと判断したんでしょうね。このへんまででだいたいこの囲碁の骨格ができたけど、すでに白(セドル)は絶望的だと思います。棋士はみんなそういう評価だった。
山本 この時点で黒が勝ってるの? ちょっとわからないな……。
大橋 数えると白が20目くらい負けてる。
山本 へえ、だいぶ差がありますね。このあと、黒は盤面の真ん中の陣地を取れるのかな? 真ん中は取りにくいというイメージがあるんだけど。
大橋 アルファ碁は中央を取りに行くのがうまいんですよ……。で、セドルさんも中央に進出しないと負けちゃうから、入っていくんですけど、なかなか厳しい。このあたりで、セドルさんは残りの持ち時間30分くらいのうち、20分くらいを使いました。それでも、アルファ碁のほうがいいんですよね。もうセドルさんには手がないように見えたそのとき、78手目に驚愕のワリコミ(相手のひとつあいた石と石の間に打つ手)を放ったんですよ。
白78手目
加藤 すごい妙手だと言われていましたね。どういう意味の手なんですか?
大橋 ここからうまく打てば3つの石がとれて、中央が急に白の陣地になってくるんです。それが決まればだいぶ逆転ムード。アルファ碁開発者のデミス・ハサビスさんのツイートを見ると、この時点ではまだアルファ碁は自分が70%くらいの勝率だと判断してるんですよね。たしかに、この時点ではまだ黒が有利です。このあと、正確に打てば黒が勝ちます。でも、ちょっとややこしくて、コウ(※)になる可能性がある。その変化をアルファ碁は避けたのかな、と思いました。あとこの先、取られる・取られないの死活問題を正確に読む展開になるんだけど、そのあたりがアルファ碁は苦手なんじゃないかな。※ お互いに交互に相手の石をとって、無限に続きうる形。特殊ルールを適応する。
山本 アルファ碁は別に、ごちゃごちゃした局面を避けたりはしないんですよ。でもアルファ碁のアルゴリズムは、細い1本道の手順は正確に読めないんです。つまり、正解がひとつしかなく、それ以外の手を打つと悪くなる手順を、正解に向かって読んでいくことはできない。そして、このセドルさんの手はまったくアルファ碁は予想できてなかったと思います。
大橋 アルファ碁は、予想できない手に弱いとは言われていたんですけど、第1局から3局までは布石がうますぎて、こういう展開にならなかったんですよね。
山本 その弱点を見事についたということですね。
コンピュータには、論理力が足りない
加藤 なんというか、コンピュータが先の手を読めないというのが不思議なんですけど……。そもそもコンピュータは、すごい計算量で先を読むのが得意なんじゃなかったんですか。
山本 どんどん先を読むという意味では、そもそもディープラーニングはそれがあまり得意ではないですね。そして今回の場合は、読む量というより、「セドルさんが打ったような手を読めなかった」のが敗因です。囲碁や将棋のようなゲームは、情報量が多いから、すべての場合を先読みすると大変なんですよ。だから、読みを省略する技術が採用されるんだけど、その「枝刈り」に失敗してるんですよね。つまり、読むべきいい手までカットしてしまった。 手の探索って、一つの局面から、自分の指す手の数だけ分岐があって、その分岐の先に相手の指す手の数だけ分岐があって……というツリー図をつくって評価をするんです。将棋やチェスでは、自分の手は一番評価値が高くなるもの、相手の手は相手が最も有利になるもの(評価値が低いもの)、をそれぞれ選んでいって、読まなくても計算結果が変わらないものは計算コストを下げるためにカットしていくんですね。これは「アルファ・ベータ探索」という方法なんですが、アルファ碁はそれを採用してないんです。
加藤 じゃあ、アルファ碁はどうやって読む手を選択してるんですか?
山本 アルファ碁はディープマインド社が開発したDQN(Deep Q-Network)というアルゴリズムを使っているのですが、これは「Qラーニング」という強化学習の一種を用いて、画像から最適な行動を学んでいくというものなんですね。
加藤 DQNを使ったプログラムは、スペースインベーダーやブロック崩しの画像とコントローラを与えたら、勝手に学んで、人間のプロに勝つまで強くなった、と記事で読んだことがあります。その会社をGoogleが買収して、アルファ碁を作ったんですよね。
山本 そう、その方法でアルファ碁はプロの手を膨大な棋譜から学んだんですよ。そうしてある局面を与えたら、次にプロが打つ手を57%くらいの確率で予測できるようになった。それを元にアルファ碁 ver.1をつくって、自己対戦させた。で、勝った方の選択した手の確率をちょっと上げる。そして、次にそのバージョン同士を戦わせて、勝った方の手の確率を上げる……これを1万世代くらいやるんですよ。そして、最終的に勝ったほうの局面を良い評価値にして、負けた方を悪い評価値にする。今の一番強いバージョンは、プロの手の確率と自己対戦で学んだ評価を組み合わせて打ってるんです。
加藤 打ち手の予想は、プロが打つ手から学習しているんですね。
山本 そうなんです。そして、強化学習したものは利用しないようです。だから、プロの手で確率が低かった手は読まない。
大橋 セドルさんの78手目のワリコミは、アルファ碁は打たれる確率が1万分の1くらいと判断していたらしいですよ。
山本 ああ、そういう手は読まないですよね。これは将棋でも同じですが、コンピュータは論理の積み重ねでずっと先にたどり着くような手が、ぜんぜん読めないんです。一見よくない手だけれど、論理的に考えていくと良くなる手というのが苦手です。例えば、将棋プログラムでも有名な手があって、いわゆる2八角ですね。これは、2八という場所にプログラム側が角を打たされて、20手以上かかる手順の末に必ず取られてしまうというもので、将棋電王戦にも出てきましたよね。角を取るために、人間側はいろいろ違和感のある手を指すんですよ。その間の手の評価値が悪いから、プログラムはまさかそんな手指してこないだろう、と思ってぜんぜん読まない。途中の手はひどいけれど、最後にまったく別の目標があるという手順は、コンピュータの想定外なんです。
電王戦でコンピュータが28角を打ったところ。この後、先手は、香車、玉、桂馬、金、飛車を動かして、打った角を捕獲できる
大橋 それはすごく納得ですね。このあと、アルファ碁はよくわからなくなって、変な手を打ち始めます。
山本 「水平線効果」が出てますよね。水平線効果というのは、プログラムが読める手には限りがあり、その先を水平線の先にあるもののように考慮せずに、長期的に見ると問題がある手を選択してしまう問題です。一時しのぎで、致命的な結果を避けようとする。将棋では、負けそうになると無駄な王手をし続けたりします。
大橋 ここで踏ん張れば、まだいい勝負ができたのに。おそらくこの辺は、アルファ碁は自分が優勢だと思ってるんですよね。で、コウとか死活とかが発生しそうな部分に対応すると自分の勝率が悪化するから、そのへんは手をつけないで、取れそうな石を取りに行く。だけど、取れない。で、「ここ取れそう」「あれ、取れない」「やっぱり取れそう」「取れない」っていうのを繰り返している。
山本 これまでめちゃ強かったのに、いきなり頭悪そうな感じになった(笑)。
大橋 で、97手目には戦いが起こっているところから離れた場所にいきなり打った。これは本当に最悪の水平線効果が出てますね。
97手目
山本 いや、でもこれを打つことで致命的な局面は2手くらい先送りにされたんじゃない?(笑)。だからコンピュータからすると、こういう手を打つ合理的な理由があるんです。イヤなことは先送り(笑)。
加藤 なんか、アルファ碁に急に共感しました(笑)。こういう水平線効果って、プログラムの工夫で避けられないものなんですか?
山本 水平線効果を本質的に回避するには、論理が必要なんですよ。そして、コンピュータは論理が非常に弱い。
加藤 ええと、論理が弱い? むしろコンピュータは論理的にしか動けないのでは……。
山本 コンピュータは、論理的に動くけれど、本当の意味での論理力は足りていないんです。論理力は人間のほうがある。ここでアルファ碁が自分の打つべき手を見つけるのは、論理的に考える力が必要なんです。
加藤 つまり、そういう本当に論理的な考え方をするためのプログラムは、あまり書かれてないと。
山本 うん。本当の論理力をつけるプログラムの書き方は、今の時点ではわかりません。
加藤 最近の将棋プログラムはあまり水平線効果が出ないから、そこは解決されたのかと思っていました。
山本 あれは、強くなって水平線が遠くにいっただけなんです。だから根本的には解決していない。評価関数の精度が上がって、つまり勘が良くなったから、水平線効果が出るような局面になってないんです。評価値が極端に悪くなったら投了するように設定してあるし。終盤、最後の最後まで指させたら、今でも将棋プログラムは元気よく王手ラッシュをしますよ(笑)。
加藤 なるほど(笑)。
有名な手順がわからなかったことで、アルファ碁を甘く見てしまった
加藤 そしてこのまま、優勢になって第4局はイ・セドルさんが勝ったわけですが。
大橋 終局後の記者会見でセドルさんは「今日ほどうれしいことはない。何にも代えがたい、値打ちをつけられない1勝だ」と言っていましたね。本当にすばらしい対局だったと思います。
加藤 いや、よかったです。そして、次の第5局はセドルさんが黒番になったんですよね。
大橋 4局目が終わったあとの記者会見でセドルさんが、「私はまだ黒番(先手)では勝ってない。アルファ碁は白番(後手)のほうが強いと言われているらしいので、今度は黒番で挑戦して勝ちたい」と申し出て、ディープマインド社側もそれにOKを出したんですよね。
山本 いちいちかっこいいこと言うなあ。
大橋 かっこいい人なんですよ。で、本局の序盤はセドルさんが、堅実に地をかせぎにいくという方向性で始まりました。ぼくはあまり、それはよくないと思ったんです。広い構えの雄大な碁のほうがいいと思うんだけど……。
山本 そのほうがややこしい戦いになるから、ということですよね。でも、広い構えでいくと、序盤が耐えられないのかもしれない。アルファ碁は序盤が強いから、そこで差をつけられると中盤以降勝負にならない。序盤はもたせて、中盤少し不利でも勝負形に持ち込もうと思ったのかなと。
大橋 でも、24手目くらいで、プロの見解としてはあっさりと白(アルファ碁)がよいということになってしまいました。 で、中盤に入るくらいまでアルファ碁がよかったんですけど、58手目でちょっと間違えるんです。石塔シボリという有名な手筋があって、15手くらいの攻め合いの先に石を取られてしまうという手順を読めてなかった。
58手目
山本 つまり、第4局と同じだよね。そういう長い手順の先に損をする展開は、コンピュータは読めない。でも人間はパターンとして知ってるから、回避できるんでしょう?
大橋 そうだね。
山本 人間、ずるいな(笑)。
加藤 山本さん、何目線ですか(笑)。ところで、そういう形を覚えさせて、回避させるプログラムは書けるんじゃないですか?
山本 できますけど、副作用が心配なんですよ。例えば、その形ばかりにこだわって、別のところで大損するようなプログラムになってしまうかもしれない。だから、そういう不自然な対策はしないほうがいいと思います。
大橋 この時点で、人間は黒(セドル)が有利だと判断しました。
山本 解説をしていた武宮先生も「セドル勝ちましたね」と力強く宣言してたのを覚えています。
大橋 でも、このときアルファ碁の形勢判断では自分が有利だと考えていたらしいです。これは、人間の側にバイアスがかかっていて、石塔シボリの手筋が読めない人は初段以下、10級くらいの弱さだと思っちゃうんですよね。人間は文脈で考えるので、その手だけを純粋に評価できないんです。こんな手を打つってことは、こいつは弱いなと考えちゃう。 ぼくは、対局が終わったあとにここでアルファ碁がどれくらい損をしたのか3日くらい検討したんですよ。そうしたら、ほんの2、3目だという結論に達しました。
山本 あれ、実況解説しているときは10目くらい損してるって言われてなかったっけ。
大橋 そう言ってる先生もいましたね。ぼくは、そのときは5、6目かなと思ってた。でも本当は、もっと少なかったんだよね。たしかに石は取られるんだけど、こっちのほうが厚くなっているから。厚くなった分のプラスと取られた損を足し引きしたら、まあ2、3目だなって。
加藤 厚くなる、というのはどういう状況ですか?
大橋 白(アルファ碁)の勢力が強くなる、という感じですね。石は何個か取られるけど、勢力が強くなった結果、中央に陣地を広げやすくなった。でもそれは、すぐにはっきりしない得で、石を取られるのははっきりした損だから判断が難しい。ちなみに、石を取るのは「現ナマ」って言うんですけど、プロは現ナマの損を過大評価する傾向がありますね。
山本 プロというか、人類はそうだよね。あと人類は初心者のときにしでかした失敗を重く見る。それをやる人は弱いし、自分がやったらすごく悪い手を打ったと考えるよね。
大橋 それはある。で、セドルさんもアルファ碁が石塔シボリを読めなかったあたりで、自分が優勢だと思ってしまった。だから、そこで戦線を縮小して、地道にいけば勝てると考えてしまったんです。小さな領域にこもって、そこを確保する手を打ってしまった。BSプレミアムで対局の解説をしていた王銘エン先生も、「セドルさんでもこういうゆるみがあるんですね」と驚いていましたね。王銘エン先生は、台湾のコンピュータ囲碁のプログラム開発アドバイザーをやるくらい、コンピュータ囲碁に詳しいんです。でも、アルファ碁の論文が出た次の日に、これは勝てないと電話して開発チームを解散したんだとか(笑)。
加藤 なるほど、おもしろいなあ。セドルさんは、相手を過小評価して、自分がそんなに優勢でないのに優勢と思い、安全な手を打ってしまったわけですか。
大橋 はい。そして、その後、劣勢に気づいたセドルさんは必死に追撃したんですけど、最後は2目半くらいの差で負けました。
山本 たった2目半と思うけれど、このレベルだと逆転の可能性はないんでしょうね。
大橋 第5局が終わったあとの記者会見で、「対策したのに勝てなかったこの敗北は、最初に三連敗したときよりもつらい」とセドルさんは言っています。でも、全5局の対局を振り返って、「碁の本質は楽しむこと。アルファ碁との対局はずっと楽しかった」と締めくくった。あんな大変な対局の直後にこのコメントが言えるなんて、最後までかっこいいですよね。人類代表として出た棋士がセドルさんで、本当に良かったと思いました。
(次回、4/18更新予定)
構成:崎谷実穂