-->

2010年10月11日

いよいよ本日10月11日、清水市代女流王将とコンピュータ将棋「あから2010」の世紀の対局が行われる(情報処理学会-コンピュータ将棋プロジェクト駒桜 | 女流棋士会ファンクラブ)。平手一番勝負、持時間各3時間のガチンコ勝負である。清水女流王将はタイトル獲得合計43期の歴代1位の記録を保持する女流棋士の第一人者であるが、「あから2010」の相手は少々荷が重いとする意見が大半のようだ。

情報処理学会によれば、「あから2010」は次のようなシステムだ。

  • 情報処理学会の「トッププロ棋士に勝つ将棋プロジェクト」特製システム
  • 阿伽羅(あから)は10の224乗という数を表し、将棋の局面の数がこの数に近いことに因んで命名された
  • ハードウエア部
    -東京大学クラスターマシン:
     -Intel Xeon 2.80GHz, 4 cores  109台
     -Intel Xeon 2.40GHz, 4 cores  60台
                 合計 169台 676 cores
    -バックアップマシン:4プログラムそれぞれについて1台ずつ
     -CPU: Xeon W3680 3.33GHz 6cores
     -Memory: 24GB (DDR3 UMB ECC 4GBx6)
  • ※ 使用ハードウェアは当日変更される可能性もあります。(2010年10月6日追記)
  • ソフトウエア部
    -構成:国内トップ4プログラムによる多数決合議法(4つのプレイヤープログラムに局面を渡し、指し手を受け取り、もっとも多い手を指し手として返す)
     -合議マネージャ: 開発:電気通信大学伊藤研究室&保木邦仁
     -プレイヤー1:「激指」開発:激指開発チーム(鶴岡慶雅、横山大作)
     -プレイヤー2:「GPS将棋」開発:チームGPS(田中哲朗、金子知適ほか)
     -プレイヤー3:「Bonanza」開発:保木邦仁
     -プレイヤー4:「YSS」開発:山下宏

将棋は局面ごとにルール上指すことができる手が平均80手あり、終局まで平均115手前後からなるため、場合の数は80115程度、すなわち、10224=「阿伽羅」程度となる。これがあから2010の由来だ。ちなみに来年にはあから2011となる予定だそうだ。


情報処理学会-あからキャラクター

1997年に世界チャンピオンを破ったDeep Blueは、スーパーコンピュータに512個のチェス専用VLSIプロセッサを追加した化物システムだった。今ではPC用ソフトでも世界チャンピオンを破るようになっているが、チェスの場合の数は10120に過ぎない。将棋が未だコンピュータに勝てない理由の一つはこの場合の数の多さだ*1

あから2010は169台676coresのシステムからなり、システムスペックから言えばDeep Blueを軽く凌駕する性能を有している。それでも場合の数の増加率に比べれば全然足りない。そんな状況下にあっても、コンピュータ側には余裕が見て取れる。情報処理学会将棋プロジェクト推進責任者である、はこだて未来大学松原教授によれば、今回の挑戦を手始めに順調に勝ち続けて、あから2012もしくはあから2013がトッププロに勝つ皮算用をしているようだ*2。本エントリでは、「情報処理」 Vol.51 No.8のミニ特集『コンピュータ将棋の不遜な挑戦』に基づき、情報処理学会の自信の裏にある技術について紹介したい。

第20回世界コンピュータ将棋選手権

今年の5月2日から4日にかけて開催された第20回世界コンピュータ将棋選手権では、あから2010に採用されているソフトウェアが登場している。あから2010では激指、GPS将棋、Bonanza、YSSの4プログラムの合議制によって指し手を決めるアルゴリズムが採用されている。この合議制及び最近のブレークスルーであるBonanzaメソッドに関しては、『コンピュータ将棋の現状:三人寄れば文殊の知恵は正しいか?』で解説しているので参照願いたい。「コンピュータ将棋の最近の動向-20回目を迎えた世界コンピュータ将棋選手権-」*3からハイライトを紹介しよう。

GPS将棋は314台の大規模クラスタシステムを投入、一気に並列化を進めた。一方、Bonanza Felizは楽観的合議アルゴリズムの採用を行い、昨年の文殊で初めて採用された合議アルゴリズムの改良を行っている。GPS将棋やBonanzaなどのライブラリが公開されたことは、レベル向上に大きく寄与しているようで、Bonanzaライブラリを利用した芝浦将棋やボンクラーズが2次予選を圧倒的強さで勝ち上がり、決勝でも強豪ソフトを倒すような活躍を見せたのが印象的だった。

決勝リーグの結果は次の通り。

プログラム名 1 2 3 4 5 6 7 SB MD 順位
1 GPS将棋 5○ 6○ 7○ 3○ 2○ 5 2 12.0 5.0 3
2 大槻将棋 7○ 1 6 1.0 0.0 6
3 Bonanza Feliz 7○ 5○ 2○ 3 4 3.0 1.0 5
4 ボンクラーズ 5○ 2○ 7○ 1○ 3○ 5 2 11.0 5.0 4
5 芝浦将棋 2○ 1 6 1.0 0.0 7
6 激指 4○ 2○ 3○ 8○ 7○ 5○ 6 1 17.0 10.0 1
7 YSS 5○ 1 6 1.0 0.0 8
8 習甦 2○ 4○ 3○ 1○ 5○ 7○ 6 1 16.0 10.0 2

優勝は2年ぶり4回目優勝の「激指」、2位は出場3回目ながら前回同様決勝に残った「習甦」、3位は昨年覇者で314台のPCクラスタ構成をとった「GPS将棋」、4位はBonanzaベースの並列マシンである「ボンクラーズ」、5位は合議アルゴリズムを採用した「Bonanza Feliz」となった。あから2010では決勝に残った「激指」「GPS将棋」「Bonanza」「YSS」が169台 676 coresのマシンで並列演算を行ない、合議制で指し手を決めることとなる。

実際に対局を観戦し解説を行っていた広瀬六段が「プロ棋士から見た選手権2010」*4という寄稿を行っているので、それに従い決勝から「Bonanza Feliz」と「習甦」のプロをも唸らせた対局を一つ紹介しよう。この将棋は途中までプロのタイトル戦でも出現した最新形で、▲4三金と「詰めろ」をかけた状態である(図1)。この局面はプロが見れば、第一感は「先手勝ち」と思う人が多いようだ。というのも、後手玉がいかにも危なそうなのに対し、先手玉は危ない形をしているものの、桂と香ではなかなか詰ますのは容易ではないと感じるからだ。しかし、実際には後手の「習甦」の勝ちとなった。

図1図2

図1以下の指し手は次のとおりだ。
△4五歩▲同玉△4四香▲3六玉△3二歩▲2四桂△3九竜▲3八飛△2四銀▲2二歩成△3八竜(図2)まで後手の勝ち。

「習甦」が△3八竜を指した瞬間に「Bonanza Feliz」が突然の投了となった。開発者や観戦者、プロの解説者にも原因が分からずバグではないか?と疑問の声が上がった。解説を行っていた広瀬六段は後にこう語っている(図番号のみ修正)。

この将棋を解説していた私は、この局面での投了をみて、「え!?」と思ってしまった。コンピュータが投了したということはもちろん詰みがあるのだろうと考えたのだが、パッと見では詰まないように見えたからだ。結局20秒ほど考えて解説場にあったパソコンに詰ましてもらうという恥ずかしいことになってしまったのだが、図2からの詰みは予想を上回る鮮やかな手順であった。

図2以下の手順
▲3八同銀△4六飛▲2七玉△1五桂▲2八玉△3六桂▲1九玉△2七桂不成!▲1八玉△2八桂成▲同玉△3九角成▲2七玉△3八馬▲同玉△4九飛成▲2八玉△2七歩▲同玉△1五桂▲3七玉△3六銀▲同玉△4六竜まで詰み

手数が長くなってしまい恐縮だが、手順中の△2七桂不成手が私の発見できなかった手で、ここを△2七桂打としてしまうと詰まなくなってしまう。変化は多岐にわたり、それぞれ非常にややこしいのだが、ぜひとも盤に並べていただいて先手玉が詰んでいることを確認いただきたい。

広瀬六段によれば正直なところ図1から図2への手順は、各手の選択肢が広く難解で、最適かどうかは分からないそうだ。それでも「一目先手勝ち」というプロの第一感があてにならないほどコンピュータ将棋のレベルが上がっていることを如実に示した対局となった。もともとコンピュータ将棋は詰将棋の強さに定評があったが、Bonanzaメソッドに基づく評価関数の最適化を伴なうプロ棋士公式戦の自動学習を通じて、序中盤でも悪手を指すことがなくなり、極めて強くなったと言える。

コンピュータ将棋を連続対戦させるfloodgateにおける激指のレーティングはほぼ3000近くに達している。floodgateのレーティングは人間用のインターネット将棋道場である「将棋倶楽部24」のレーティングに比較して300点ぐらい厳しいと推測されるので、激指が持ち時間の短い設定で「将棋倶楽部24」に参加すれば3300点ぐらいになるとみられる。ちなみに「将棋倶楽部24」の2010年9月度レーティング十傑戦における最上位者s.o.s氏のレーティングは3125点である。レーティングを信じれば、「激指」は無類の強さを発揮することだろう。

そもそも2008年のコンピュータ将棋選手権のエキシビションにおいて、優勝の「激指」と準優勝の「棚瀬将棋」がトップアマの清水上徹氏と加藤幸男氏に連勝している。二氏は公式戦でプロにも勝つことがある程の実力者であり、これ以降トップアマの敗戦がつづいていることから、すでにコンピュータ将棋の実力はトップアマを凌駕していると言って良い。清水女流王将の勝利は厳しいのではないかとする見方には根拠があるのだ。

コンピュータに死角はないのか?

大阪商業大学研究員の古作氏はアマ準王座、読売日本一決定戦3位などトップアマの1人でもあるが、2010年2月6日にエキシビション対局で「激指」と対戦し破れている。古作氏はその対局にあたっての戦略について「最強将棋ソフト「激指」との戦いに学ぶ―対コンピュータ戦略の必要性」*5という寄稿を行っている。古作氏は「将棋倶楽部24」のレーティングに換算して2650~2700程度とのことだが、20分切れ負けという条件では激指に圧倒された。

古作氏は予め「激指9」を自宅のPCにインストール、20分切れ負けを意識して、制限時間の負荷をかけたトレーニングを積んだ上で対局に臨んだという。私物のノートPCという非力な環境であっても「激指9」は「将棋倶楽部24」のレーティングで2500程度はあると感じられたそうだ。

古作氏はコンピュータが苦手の展開に持ち込むための次の3つの戦略を提示している。

  1. 探索範囲より先に好手がある戦型に誘導してコンピュータをハメる
    • 十数手後を想定した誘いのスキや撒き餌を作ってコンピュータをハメることは戦術の一つとして有効。ただし、人間の想定よりコンピュータの探索深度が深い場合にはこの戦略は無効となる。
    • その場合、定跡あるいは定跡に近い互角とされる局面で、先後どちらか一方だけが玉が堅く、攻めの権利を握るような展開、あるいは片方がデータ的に圧倒している定跡に持ち込む「戦略的ハメ手」を用意することが有効。
  2. 均衡状態を作って手待ちにし、コンピュータを揺さぶる
    • 右玉を基本とした先日手含みの戦略で、争点を作らず注意しながら手待ちをする。攻めて来たらカウンターで少しずつリードを広げ、動いてこない場合には手待ちを繰り返し、コンピュータがミスをするのを待つ。
    • 現在のコンピュータは間合いを図りながらの手待ちがあまりうまくない印象。
  3. 入玉含みの戦略を取り、コンピュータのデータ不足を突く
    • コンピュータが入玉を含みとした持将棋模様の展開に弱いということは以前から知られている。入玉が確定した玉は殆どの場合詰ますことが不可能で、駒をできるだけ多くとって点数勝ちを目指すことにゲームの目的が変化する。その変化にコンピュータは対応できない。

この3つの戦略を持ち、万全の準備をもって対局に臨んだ古作氏、当日は相居飛車なら矢倉志向、飛車を振られたら居飛車穴熊志向のじっくりした戦形による総力戦というゲームプランで臨み、予定通り相矢倉に進み、定跡形とは少し異なる形になったが、「激指」の駒組みがやや変則的で、序盤は作戦勝ちかと思われた。

しかしながら、20分切れ負けという制約の中で、「激指」に想定外の手を打たれて、古作氏は動揺、数手後に致命的なミスを犯し、そのまま「激指」に圧倒されるという結果となった。古作氏によれば、短時間勝負では1秒間に大量の局面を読むことの出来る「激指」に勝つことは極めて難しく、意表をつく手に人間が対応するには最低限2時間程度の持ち時間は必要とのことである。

本日の清水市代女流王将と「あから2010」との対局は各3時間持ちで、それが切れたら1分間の秒読みとなる。コンピュータ同士の対戦は25分切れ負けなので、3時間という長い持ち時間を有効に使えるか、長くなった分だけ強くできるかがコンピュータ側の課題となる。

一方、人間側の戦略に関しては、古作氏は次のようにまとめている。

人間が勝つためには、まず序盤でコンピュータの力の出にくい展開にすること。中盤に入ったら、押さえ込みあるいははっきり一点突破できるような流れに持ち込む。終盤はコンピュータの勝負手に慎重に対応できるよう持ち時間をたっぷり残しておく。こうした要素を満たすことが不可欠であろう。

コンピュータの不遜な挑戦が実を結ぶのか? あるいはプロの直感と大局観がコンピュータを跳ね除けるのか? 世紀の対局を楽しみに待ちたい。

関連エントリ

脚注

  • *1:ちなみに囲碁の場合の数は10360とさらに多く、しばらく安泰だと思われる。
  • *2:松原仁: 「あから2010」の不遜な挑戦, 情報処理 Vol.51 No.8, pp.988-990 (2010).
  • *3:瀧澤武信: コンピュータ将棋の最近の動向-20回目を迎えた世界コンピュータ将棋選手権-, 情報処理 Vol.51 No.8, pp.991-1000 (2010).
  • *4:広瀬章人: プロ棋士から見た選手権2010, 情報処理 Vol.51 No.8, pp.1016-1017 (2010).
  • *5:古作登: 最強将棋ソフト「激指」との戦いに学ぶ―対コンピュータ戦略の必要性, 情報処理 Vol.51 No.8, pp.1018-1021 (2010).


lunarmodule7 at 11:03│この記事をクリップ! twitterでつぶやく このエントリーをはてなブックマークに追加 このエントリーを含むはてなブックマーク はてなブックマーク - 清水女流王将 vs コンピュータ: 世紀の対局を楽しむために Computer Science