Googleの「AlphaGo」が3月に世界最強囲碁棋士のひとりイ・セドル9段と対局し、AlphaGoが5戦中4勝を挙げ、コンピューターが人間を凌駕するのはまだ先だろう思われていた囲碁界に激震が走ったことは記憶に新しい。そのAlphaGoに対抗すべくイ・セドル対局前にプロジェクトの始動を発表したのが「DeepZenGo」です。それから半年、DeepZenGoの開発は進み、AlphaGoの論文が発表された当時のレベル程度になったことを確認し、今回急遽、第2回囲碁電王戦を開催することになりました。
- 第 1 局 11 月 19 日(土)
- 第 2 局 11 月 20 日(日)
- 第 3 局 11 月 23 日(水 祝)
【関連記事】
- 打倒『AlphaGo』! ドワンゴ川上会長も本気出したコンピューター囲碁ソフト『DeepZenGo』プロジェクト始動
- Googleの囲碁AI『AlphaGo』がプロ棋士に勝利、史上初の快挙。自己対局を機械学習して上達
- Googleの囲碁AI vs人類最強棋士の対局中継は9日13時から。DeepMind AlphaGo対 イ・セドル9段、第一局はAlphaGo勝利
▲「DeepZenGo」プロジェクトはZenの開発者を各機関がサポートする形で行なわれている
DeepZenGoは、AlphaGoの論文を基に、単に真似をするのではなく、Zenのいいところを活かしつつ、ニューラルネットワークを用いたアルゴリズムを開発してきたとのこと。プロジェクト開始時は、2450程度だったレーティングが、ディープラーニングを本格的に開始したところ2900弱にアップ。さらにこれまでポリシーネットワークだけだったのをバリューネットワークの学習(AlphaGoの論文では、ニューラルネットワークを用いてバリューネットワークとポリシーネットワークの2つの構造にわけて、それぞれ学習し精度を高めている)を進めた結果、3000に到達。KGS Go Serverのレーティングで10dとなり、昨年の10月にAlphaGoが発表された当時のレベルには到達したとしています。ただ、イ・セドルと対局したときは、およそ3600にまで達していたと考えられており、さらなる開発が必要です。
▲プロジェクト始動時からのレーティングの推移。順調に伸ばし、半年で500以上あげたことになる
▲KGSのレーティングでは7dレベルから一気に10dにジャンプアップ
▲AlphaGoが論文で対局したとされる樊麾 (Fan Hui)氏が中国プロ2段で約3000程度。そのレベルは超えたがまだ先はある
ドワンゴの川上会長は、「突如AlphaGoが現われて、世界最強棋士と対局しただけで終わりにしてしまったら、囲碁界にとって面白くない。だから囲碁電王戦をやることにしました。今回は、現時点でプロ棋士と互先(たがいせん・ハンディキャップなし)で対戦するに値する実力になったことを示す対局だと思っています。対局者に関しては、現役でもトップレベルの実力を持っていること、コンピューターとの対戦にチャレンジしていただける意欲のある方、世界的にも通用する知名度のある方ということで、趙治勲名誉名人にお願いできることになったことを嬉しく思います」とのこと。
▲ドワンゴの川上量生会長
川上会長は囲碁が大好きで、ニコニコ動画では将棊よりも先に対局の生中継を開始したといいます。ただ将棋電王戦から2年遅れて囲碁電王戦を開催。2014年の2月に、当時世界最強と言われていた「Zen」と、プロ棋士2人やアマチュア棋士、政治家の小沢一郎氏と対局しました。さすがに19路盤での対局とはいかず、プロ棋士とは9路盤、アマチュアとは13路盤、小澤氏だけ19路盤でした。
Zenの開発者の一人、加藤英樹氏は「3番勝負だとどちらかに偏る可能性もあるので、もう少しあると良かったですが。趙治勲先生と対局できるのは嬉しいです。3月に小林光一名誉棋聖と三子で挑戦した際、人づてに聞いたのですが、趙治勲先生が『戦うのは10年早い』とおっしゃったそうで、ここはZenが勝って恩返ししないといけません」と挨拶。
▲Team Zenの加藤英樹氏
これに対して、対局相手の趙治勲名誉名人は「補足になりますが、小林光一先生との対局はZenが三子で勝ったのですが、内容的にとても互先で打つレベルではなかったんです。10年早いと言ったかは覚えていませんが、口は災いの元、今すごく後悔しています(笑)。ただ、そういう恩返しは結構です。僕に負けるほうが恩返しです(笑)。9月の時点のZenの対戦13局を並べてみてみました。棋譜を見るということは、結果論になってしまうのですが、15秒ではいい手も悪い手も出ますし、僕にはできません。Zenはめちゃくちゃ強いですし、AlphaGoのときもそうでしたが、将棋やチェスとは違い碁石自体には価値がなく、強い人打つことでダイアモンドにもなる。適確に考えるのが人工知能で、アホな人間は必要なくなるんです。あと50年は生きたいので、ここで負けるわけにはいきません(笑)。人間と打つのは飽きてきたので、非常に楽しみですね。私が勝ったら、再戦を受けますよ。負けたら何処かへ帰ります(笑)」とウィットに飛んだしゃべりで記者たちをわかせていました。
▲趙治勲名誉名人
AlphaGoとの違いについて加藤氏は「AlphaGoとは、ディープラーニングの仕方やネットワークの構成の違い、ディープラーニングも新しい技術を取り込んだりしています。AlphaGoのような、比較的戦いを避ける方向ではなく積極的。Zenの雰囲気をかなり残しています。戦いが好きがどうかということは、私の棋力ではわからないですが、序盤薄くならずに地を増やすのがうまく、このあたりはAlphaGoと同じですね。相手にスキがあると攻めますが、あまり突っ込みすぎて逆転負けということもあるので、そのあたりがZenかなと思います」。
関根正之氏(東京大学大学院工学系研究科 技術経営戦略学専攻 松尾研究室 研究員)は「ディープラーニングの手法も量より質を意識して取り組んでいます。まだ成長期なので、(戦いが好きという)性格がどうなるかわからないので予測はつかないです」。
▲東京大学の関根正之氏
Zenの印象について趙治勲名誉名人は「普通に強いです。ただ棋譜を見ただけでは勝てそうな気はするけれど、それは自分の弱さに気がついていないからかもしれません。3月の時点の小学生レベルが脳裏に残っているし、棋譜は結果論ですから悪い手もわかります。誰の棋譜を並べても同じで、勝てる気がするんです。でも自分がもっと弱いということをすごく忘れている。ただそれだけのことですね。Zenの手の読み方は人間的です。なかでも布石感覚がとてもうまくて、終盤より序盤のほうが学ぶべきところがありますね。3月の時点は人から教えられてやっている感じがしましたが、いまは自分が答えを出す感じですね。だからどんどん強くなると思います。人間は負けると悲しいから酒を飲みに行ったりしますが、コンピューターは負けたらすぐ勉強ですから、今回もし1局目負けたらすぐ家に帰って勉強します(笑)」。
「AlphaGoのときもそうですが、数ヵ月で別人になるぐらいのレベルアップをしています。なので9月の13局をすべてを並べていないです。すべて並べてしまうと、その力量だと思っちゃって自信過剰になり、お酒を飲みに行っちゃう(笑)。だからその碁は忘れるようにしています。対局は絶対勝つという自信を持っていたのですが、今日いろいろと話を聞いてみたり、互先は自信があるのかと聞いてみると『ある』と答えるんです。ですからこれは怖いですね。ただ、怖さよりも楽しみのほうが強いですね。万が一僕が負けてもまだほかにもいるんです。5段階ぐらい。私が勝つと思いますが(笑)」と明るく答えていました。
現在のバージョンは12.7なので9月の時点(12.4)より確実に進歩しているはずです。さらに9月の時点のハードの性能も違うと川上会長は補足していました。今回対局で使用するマシンは、CPUはインテル Xeon E5-2699v4(2.20GHz/3.60GHz)を2基(合計44コア/88スレッド)、GPUはNVIDIA TITAN X(Pascal世代/3584コア)を4基使用。メモリーは128GB、SSDは128GB(OS用)+480GB×2という構成。将棋電王戦に比べれば遥かにハイスペックではありますが、クラスタ接続しているAlphaGoに比べればスタンドアローンなので、かなり非力になります。
川上会長は今後について「AlphaGoに挑戦したいですし、私たち以外にも開発をしている人達がいるということなので、そういった人達と対局してみたいですね」と、囲碁電王戦以外も視野に入れていることを明らかにしました。
▲今回のプロジェクト関係者と趙治勲名誉名人
プロ棋士側は、コンピューターが急に強くなったことに戸惑い、おそらく将棋のときと同様「弱点」を探してそこを突くような行動に出るかもしれません。ただ、その行動は将棋電王戦を見る限り得策ではありません。そのような「迷い」や「スキ」があると、コンピューターの術中にハマって勝負を落とすことになるかもしれません。日本製の囲碁プログラムがどこまで戦えるものに仕上がっているのか、第2回囲碁電王戦は今後を占う上でも要注目です。
▲ニコ生での各対局における解説者と聞き手、立会人のメンバー
■ 対局スケジュール
- 第 1 局 11 月 19 日(土)
- 第 2 局 11 月 20 日(日)
- 第 3 局 11 月 23 日(水 祝)
■ 対局ルール
- 対局は三番勝負。ただしどちらかが 2 連勝したとしても 3 局目を行う。
- 互先、先番 6 目半コミ出し。
- 日本ルール。
- 対局は日本囲碁規約に準ずるものとする。
■ ニギリ
- 1 局目の対局開始直前にニギリを行い、黒番・白番を決定。
- 3 局目の対局開始直前にニギリ直しを行い、黒番・白番を決定。
■ 対局者の持ち時間
- 13 時対局開始。持ち時間は手合時計計測で 2 時間。
- 持ち時間を全て消費した場合は、60 秒の秒読み 3 回までとする。
■ 立会人
- 日本棋院の棋士1名が立会人を務めることとする。
- 立会人は、対局全般(対局開始、終了、トラブルの判定、ミスの判定を含む)をコントロールする権限を持つ。
■ コンピュータの対局条件
- 対局が始まってから対局終了するまで、コンピュータへの人の操作は、原則として打たれた手の指示以外許さないものとする。
- トラブルへの対処のみ、立会人の立会いのもとにコンピュータを操作することができる。
■ 時間のカウントに関して
- 人間側は手合時計を使用し、コンピュータはコンピュータ内の時間を正とする(但し、コンピュータ側はコンピュータに手を入力する時間、およびコンピュータの手を盤上に再現する時間は含まない)。