八尋伸

プロ棋士に迫ったAI「Bonanza」 保木邦仁「将棋を知らないから作れた」

5/26(火) 10:08 配信

コンピュータは永遠にプロには勝てない──。将棋AI(人工知能)はかつて、こう言われていた。2005年6月、そんな世界に突如、トップ棋士に迫る実力を持った将棋AIが現れた。Bonanza(ボナンザ)だ。開発した保木邦仁さん(44)は当時、将棋をほとんど知らない光化学の研究者だった。将棋を知らないからこそ得られた発想と、異分野の研究をしていたからこその気づきが、ブレイクスルーを生んだ。(ジャーナリスト・田中徹、撮影・八尋伸/Yahoo!ニュース 特集編集部)

後悔が残る歴史的対局

2007年3月21日、将棋界の歴史に残る対局が行われた。「大和証券杯ネット将棋」の特別対局。将棋界の頂点である竜王(当時)・渡辺明氏がプロ棋士として初めて公の場で将棋AI「Bonanza」と対局した。先手のBonanzaは自陣の王将を守る「穴熊」という戦法をとると、渡辺竜王も「穴熊」で応戦。中盤までBonanzaは優勢に進めたものの、112手で渡辺竜王に敗れてしまった。大善戦に対局は沸き、この一戦によって、Bonanzaは広く知られることになった。開発者は、対局当時、東北大学大学院で助教だった保木邦仁さん(44)だ。

ただ、この対局は注目度という点で、保木さんにとって後悔が残るものだったという。

渡辺竜王がボナンザに快勝 世界最強の将棋コンピューターソフト「ボナンザ」と対局する渡辺明竜王(左)=21日午後、東京都内のホテル(写真:共同通信社)

「チェスでは、米IBMがつくったスーパーコンピュータ『ディープ・ブルー』vsロシアのチェス選手、ガルリ・カスパロフという対戦があり、1996、1997年に世界が注目するビッグイベントになりました。また、囲碁でも2016年に(Google関連会社がつくった)囲碁AI『AlphaGo』vs世界チャンピオンである韓国のイ・セドルの対局で世界的なニュースになりました。

それらと比べると、棋士の渡辺さんには申し訳ないことをしてしまった。竜王の渡辺さんを迎えるのにふさわしい、もっと大きな舞台を用意したかったという後悔があります。それはいまでも気にかかっています」

Bonanzaは、過去のプロ棋士の対局で双方が指した手を記録する棋譜を大量に読み込み、学習するAIだった。Bonanzaが学習したのはプロやアマ高段者の棋譜約6万。当時としては膨大な量だった。保木さんはポスドク(博士研究員)時代の自由な時間の中、大学のコンピュータを使い、2004年から1年かけてBonanzaを開発した。そして完成すると、ウェブ上に無償で公開した。

公開後、またたく間にBonanzaは評判になった。棋力が高いうえ、クセがありつつもコンピュータらしくない「自然な」手が多いことも注目された。

(写真: 読売新聞/アフロ)

「2005年6月、当時流行していたホスティングサービスのgeocitiesに実行ファイルを公開しました。何かに追われたわけではなく、あくまで好奇心による探求と実験。技術的な苦労はむしろ、チャレンジとして楽しみました。

何かを先取りしたとは思いませんでしたけど、面白いものができたという手応えはありました。実際、将棋愛好家のみならず、プロの間でも話題になりました。渡辺明竜王は当時、ブログに『奨励会有段者もコロコロ負けているらしいんです』と驚きを記してくれました」

2006年には、第16回世界コンピュータ将棋選手権に初出場し、優勝。2009年には、オープンソースソフトウェアとしてソースコードも公開した。アカデミズムの世界では新しい知見は公開・共有されて、さらに発展していく。Bonanzaでも同じことが起き、世界中のさまざまな人から、局面の状態を判断する「評価関数」計算の高速化、指す手を毎回探索する「全幅探索」の効率化といったテクニックが寄せられた。Bonanzaはさらに強くなった。と同時に、他の開発者から「Ponanza」「ボンクラーズ」などBonanzaをベースとした「チルドレン」と称される将棋AIが生まれるに至った。

「反響があったからソースも見せたくなったのかな。目立ちたがり屋なのかもしれません。フィードバックは期待していましたけど、予想以上の反応で、インターネットってすごいなと改めて感じました。まだSNSとかいまほど広がっていない時代です」

ゆっくりした時間の中、AIの開発を始めた

保木さんは現在、電気通信大学で准教授を務め、ゲーム情報学を専門とする。だが、2000年代初頭は東北大学大学院に所属し、光化学の研究者だった。2003年にカナダ・トロント大学のセント・ジョージ・キャンパスに渡った。

(撮影:八尋伸)

「光化学の研究が面白くなっていたところに、カナダの最先端の研究者がポスドクを募集していたので、応募しました。

当時、分子を思い通りに操って化学反応させる『制御』と、そのための計算機シミュレーションを行う研究をしていました。分子に光を当てると、分子が別の分子に組み替わります。レーザー光は太陽光と違う性質を持っていて、分子の組み替わり方も違ってきます。それをシミュレーションで繰り返し、新しい化学反応を発見できるかもしれないと思っていたのです。しかし、研究の世界では一発当てるのは大変でした」

大学まで徒歩15分ほどのワンルームのアパートに住みながら3年間を過ごした。集中すれば徹夜もする。好きな時間に大学に行って帰ってくるような、自由な研究時間を過ごすうちに、Bonanzaの開発に取り組むようになったという。

Facebookコメント

表示

※本コメント機能はFacebook Ireland Limited によって提供されており、この機能によって生じた損害に対してヤフー株式会社は一切の責任を負いません。