イベント
[CEDEC 2014]将棋でプロを倒したAIが,次に狙うのは人狼。「人狼知能」プロジェクトに迫る
4Gamer読者の多くもご存じかと思うが,2012年に始まったプロ棋士とAIが対決する「電王戦」では,AIが故・米長邦雄永世棋聖や,プロ棋士のトップリーグとも言える順位戦A級に所属する棋士を破った。タイトルを保持しているような真のトップ棋士との対決はまだ実現していないが,松原氏の“予言”はほぼ的中したと言っていいだろう。
その松原氏は今,アナログゲームの「人狼」に注目している。なぜ「人狼」なのか? そしてAIが「人狼」で人間に勝つ未来は訪れるのだろうか? 興味深い内容であった本講演をレポートする。
なお,人狼の詳しいルールなどについては,以前掲載した特集記事で確認してほしい。
関連記事:
大人気の「人狼ゲーム」を徹底解説する集中連載「特集:人狼」。本日スタートの第1回は“人狼ゲームカタログ”で,その歴史と広がりを再検証
なぜ人狼か?
氏によれば,人工知能研究にとって,ゲームは非常に良い題材であるそうで,理由として以下の4つが挙げられた。
(1)ルールが明確
曖昧なルールだったり,そもそもルール無用だったりすると,コンピュータが処理できるようにするのが難しくなる。
(2)良し悪しが評価しやすい
勝った場合は望ましい選択がなされた,負けた場合はそうでなかったといったように,評価の基準が明確である。
(3)強い人が存在する
ゲームが強い人はAIが打倒すべき目標になるし,AIの振る舞いの基礎となるデータの収集,および学習対象となる。
(4)おもしろい
研究者自身が楽しめる。
これまで,AIは将棋以外にもさまざまなゲームを攻略対象としてきた。チェスでは1997年にAIが世界王者に勝利しているし,囲碁でも2025年頃にはAIがプロを倒すのではないかと見られている。
だが,AIの快進撃は,研究者に大いなるジレンマをもたらす。強いAIを作り出せたという事実は研究者にとってもちろん嬉しいことだが,勝つのが当たり前になってしまうと,研究者の“食い扶持”が無くなってしまうのだ。
つまり研究者としては,面白く,かつ難しいゲームが常に必要なのである。
そういった視点で今後AIの攻略対象となりそうなゲームを探していくと,ゲーム上での判断に必要な情報がすべてプレイヤーに公開される「完全情報ゲーム」では,もはやAIは人間を相手にせず,候補になりづらい。
その点,人狼は推理や推測が必要な「不完全情報ゲーム」で,参加者の人数も多く,その役割も非対称だ。参加者が多いということは,それだけAIが判断・推測すべき情報も多くなるということだし,役割が非対称(プレイヤーによって目指すゴールやできることも違う)だと,ゲーム展開の幅は拡大する。
また,対話が重要な役割を果たすので,そもそも「話す」ことが苦手なAIにとっては良い課題となる。さらに,嘘をついたり,嘘を見抜いたりする,高度な知能が必要になる。そして人狼は「強いプレイヤーがいる」という条件も満たしている。
こういった条件を見ると,もしAIが人狼をプレイしたとき,一緒にプレイしている人間が「誰がAIなのか最後まで分からない」のであれば,「チューリングテスト(人とAIの区別をつけるテスト)を突破したと言えるのではないか」というのが,松原氏の課題提示である。
このように,人と「人狼」で対戦できるAIを,松原氏は「人狼知能」と呼んだ。
「人狼」への挑戦
氏はまず人狼知能プロジェクトの目標を示した。
これによると,目指すAIは
(1)人間と自然にコミュニケーションできる
(2)そのうえで,人狼がプレイできる
というものになる。
しかし,このシンプルだが絶望的に高いハードルに対して,研究者達はどこから,どのように手を付けていくつもりなのだろうか?
稲葉氏は,「人狼」のプレイ形態に2つの種類があることに着目した。1つは対面人狼(オフライン),もう1つはオンライン人狼である。
対面人狼は,1ゲームの時間が比較的短く,実際に顔を合わせてのプレイとなるため,相手の性格や反応を見ることに重点が置かれる。オンライン人狼は,BBSへの投稿で進行することもあって,1ゲームにかかる時間が数日から1週間程度と長く,プレイヤーはより熟慮を重ねる。また匿名性なので,プレイヤーの性別や見た目の影響は排除される。
稲葉氏は,人狼知能がまず目指すのはオンライン人狼だという。なるほど,対面人狼は「AIを交えて実際にやってみる」にしても大変に手間がかかるし,「性格や反応」という非常に扱いづらい情報が判断材料になる。基本的にはすべてを「掲示板への書き込み」と「書き込まれた投稿の読解」で進められるオンライン人狼のほうが,AIにとっては距離が近い。
フィールドが決まったところで,次の問題である。果たして「人狼」とは,どのようなゲームなのか。言い換えれば,「人狼」で勝つためには,どうしたらいいのか。これを理解しないことには,人狼知能に何を評価・判断させていいかも分からない。
さきほど説明したように,「人狼」は不完全情報ゲームであり,プレイヤーが持つ情報が非対称という特性も有している。分かりやすく言うと,ゲーム中,人狼のプレイヤーは誰が人狼なのかを知っているが,村人のプレイヤーは誰が人狼なのかを知らない。
この非対称な状況のなかで,プレイヤーは「説得」や「協調」といった行動を取らなければならない。どんな役割であれ,自分のことを人狼だと思い込まれてしまったプレイヤーは,遠からず“処刑”されてゲームから排除されてしまうのだから,「説得」は非常に重要だ。また,「誰を処刑するか」が多数決で決まる以上,「協調」もまた欠かせない。
そしてオンライン人狼において,プレイヤーはほかのプレイヤーに情報を与えることで(情報の重要性や真偽は別問題),その信頼を勝ち取ろうとする。「あの人が怪しいと思う」にしても,「自分はあの人が人狼だと思うので,あの人の処刑に1票を投じる」にしても,すべての書き込みは「ほかのプレイヤーに情報を与える」ことにほかならない。
また,このゲームで勝つためには,ほかのプレイヤーの思考を多段階に予測する必要がある。「自分はこのように考える」ということを決定するだけでなく,「自分がこのように考えている,と,相手は思っているだろう」というところまでの予測が必要となるのだ。
このように,見るからに難問が山積みの人狼知能だが,稲葉氏はいくつもある問題のうち,
(1)エージェント(荒っぽく言えば「AI」個人)の対話プロトコル設計
(2)「人狼」で勝利するための戦略の構築と,AIの強化学習
(3)エージェント同士を対戦させるプラットフォーム
という3点について,研究と実装を進めているという。
(1)は少し分かりにくいが,要は「人狼」というゲームをAIがプレイするにあたって,よりコンピュータ処理しやすい,特殊な言語を設計しよう,という計画である。「私は○○さんが人狼だと思います」という言葉を,一種のプログラム言語に近いものに置き換えよう,というわけだ。
言うまでもなく,これは決して簡単なことではない。「人狼」において,プレイヤーが提示する「提案」や「推理」は,非常に多彩なバリエーションを持っているからだ。
この問題に対して稲葉氏はまず,AIが行う発言を
(1)自分の役職を明かす(通常のプレイなら「私は村人なんだけど?」といった発言)
(2)能力によって得られた情報の共有(「私は占い師の力で,○○さんが人狼であると知りました」)
(3)疑っている対象の報告(「○○さんは人狼だと思います」)
この3パターンに絞り込んだ。
また「疑い度」というパラメータを設定し,「その人が人狼であると,どれくらい疑っているか」を数値で管理するようにした。
こうして設計した,いわば「人狼言語」でAI達は自己の勝利を目指して戦っていくわけだが,ここに根本的な疑問が出てくる。「学習機能を搭載したとき,果たしてAIの勝率は上がるのか」というものだ。
これは本当にシビアな問いで,実は「人狼」というゲームの根本を揺るがしかねないものでもある。もし学習機能を搭載してもAIの勝率が変わらないなら,可能性は大きく分けて2つ。1つは「人狼言語」に致命的な欠陥があった場合。そしてもう1つは,そもそも「人狼」というゲームの勝敗は運がほぼすべてを支配しており,人間が勝手に「そこに戦略がある」かのように錯覚していた場合,ということになるのだ。
幸いと言うべきか,学習機能をONにしたAIと,OFFにしたAIで対戦を繰り返した結果,学習機能をONにしたAIは勝率が向上していった。「人狼」は,「ただの運ゲー」ではなかったのである。これは完全に筆者個人の感想だが,このことだけでも人狼知能プロジェクトは,とても大きな知見をもたらしているように思える。
ただしこの「学習機能」は,そら恐ろしい未来も暗示している。学習機能によって徐々に「最適手」を探査していったAIは,「プレイヤーの残り数が5人のとき,人狼プレイヤーは誰も殺さないほうが良い」という,人狼上級プレイヤーにとっての定石を発見しているのだ。
なお,この人狼言語を用いた「人狼知能大会」が2014年度中に開催される予定だという。参加は誰にでも開かれており,学習用のデータや,プロトコルそのものも,参加希望者には配布される。参加者募集中とのことなので,興味のある方は調べてみてはいかがだろうか。
また11月19日には「人狼知能研究のすすめ(仮)」と題したAIセミナーが開催される。ここでは人狼知能サーバーに接続してゲームに参加するエージェントを実装し,実際に対戦を行うとのこと。詳しくは「こちら」を参照してほしい。
社会的知性を持ったAIの創造
大澤氏の専門は「ヒューマンエージェントインタラクション」というもので,「人」と「人間らしい人工物」のインタラクションの設計がそのテーマである。また,人狼のベテランプレイヤーでもあり,その対戦歴は10年以上。BBS人狼がメインだったが,最近では対面での人狼にも目覚めたとのこと。
大澤氏は,人狼というゲームが要求する,「社会的知性」に注目する。
社会的知性とは,乱暴に言ってしまえば,「あの人に自分はどう思われているんだろう」と妄想できる知性である。なるほど,いかにも社会を生きていくうえで必須となりそうな知性だが,このためには,相手の思考シミュレーション(あの人は,このように考えるだろう,こう判断するだろう)だけでなく,相手が行う自分の思考シミュレーションの予測(あの人は,自分がこう考える,こう判断すると思っているだろう)が必要になる。
この社会的知性は,「信頼」を形成するにあたって大きな意味を持つ。実際,なぜ人間の脳はこんなにも大きいのかという謎に対し,「相手の意図を推測するためではないか」という,社会脳仮説というものもあるそうだ。
また,「人狼」というゲームが持つレイヤーの多様さも,大澤氏が重要視するポイントだ。
稲葉氏が示したように,「人狼」は複雑なゲームである。ゲームの戦略性だけ抜き出しても考えるべきことは多いし,そのために必要となる学問領域も多岐にわたる。
ここで,将来的に対面人狼までカバーしていくことを考えると,関係していく学問領域はさらに広がり,最終的には身体性や社会学,認知科学,ジェンダー論までもが含まれていくと氏は予測する。このことは,「一部の専門家だけでなく,たくさんの領域の専門家が,自分の成果をほかと共有しながら相互に発展させていける」ことを示唆する。
そのうえで,BBS人狼という「リソース」があるのも見逃せない。BBS人狼には過去の対戦ログが大量に残っており,AIを設計していくにあたってはこれらをリソースとして用いることができる。またログはすべて日本語であり,この規模(6000件オーバー)での人狼のプレイログというのは世界的にも他に類を見ないため,日本が有利なフィールドであるというのも,見逃せないポイントとなるのだ。
さて,研究者が人狼知能に注目する理由はさておき,大澤氏は「人狼」に求められる社会的知性を,どのようにAIに処理させようとしているのだろうか。
大澤氏はここで,BDI論理(Believe-Desire-Intention論理)を紹介する。これまた難しそうだが,これは簡単に言えば,「真偽だけでなく,相手の信念や欲求を記述できる論理体系」であると氏は語る。一般的な条件式や理論式では難しい「人狼における思考を論理的に追う」ことも,これを用いればできるのではないか,というのが大澤氏の仮説だ。
この仮説を実証するため,大澤氏は人狼BBSにおける歴史的名勝負のログを参照する。このログに残っている思考の推移をBDI論理で記述できれば,「人狼」における推理や思惟の多くもBDI論理で記述できるのではないか,というわけだ。
そして実際にログをひもとき,BDI論理への「翻訳」を行ってみたところ,非常に複雑な推理も,きちんと記述可能であることが分かった。「人狼」のプレイヤーが考えていること,またその推理の構造は,我々が普段使っている言語から,より「コンピュータが処理しやすい」言語へと,翻訳が可能なのだ。
さて,ここで「人狼」が,その大原則として「ほかのプレイヤーの信頼を得るゲーム」であることを思い出すと,「人狼」における思考を論理式で記述できるということの意味の大きさが分かってくる。
つまるところこれは,人を説得できるAIを開発できるということなのだ。これが達成できれば,ゲームはもちろん,実社会においても大きな恩恵となるだろう。
「魅せる」人狼へのアプローチ
氏は,「ゲームクリエイター人狼会」という,クリエイターが集まって「人狼」をプレイする会を主宰しているが,その会を発足させた経緯がまず語られた。
イシイ氏が人狼に出会ったのは,人狼BBSだった。一時は熱心にプレイしていたが,徐々に飽きてくる。というのも,ゲームデザイナーの目から見ると,「人狼」にはゲームとして不完全な部分があるからだ。
例えば,早い段階で殺されてゲームから脱落したプレイヤーは,そのゲームの“観客”になることしかできない。これが絶対につまらないとは言わないが,たいていの場合,楽しいとは言えない。「つまらない人には,人狼ってつまらないよね」という空気が自分の中にあった,と氏は語る。
ところがある日,松野泰己氏のTwitterを見たイシイジロウ氏は,「人狼TLPT」という舞台公演があることを知る。これはセブンキャッスルが主催する公演で,簡単に言えば「役者が舞台の上で人狼をプレイする」というものだ。もちろん,ただ役者が「人狼」を遊んでいるだけではなく,各プレイヤーは「村の住人」として芝居もする。よって,自分が処刑されるとなったら,泣き叫んで命乞いをするなどといった,アドリブ満載の舞台となる。
この演目は,イシイジロウ氏を大いに驚かせた。「ゲームを遊んでいるところを他人に見せて楽しませる」ということに対し,「面白いかもしれないが,お金を払ったお客に見せられるほどの価値はないだろう」と考えていた氏にとって,人狼TLPTは「その価値があった」のだ。
もう一つ氏を驚かせたのは,人狼TLPTの中で用いられる戦略が,どんどんレベルアップしているということだ。公演として何百戦と人狼を繰り返す彼らは,「お客が見てすぐに理解できる範囲」という縛りはあるものの,勝利のための戦略をどんどん研ぎ澄ませていったのである。
これを見て,実際に出演者とも話をしてみたイシイジロウ氏は,一つの仮説を立てる。それは「人狼は,プレイヤーのレベルが上がったら,もっと面白くなるのではないか」というものだ。そしてこれこそが,氏がゲームクリエイター人狼会を設立したきっかけなのだという。
そして先日,ゲームクリエイター人狼会は人狼TLPTとの勝負を,公開の場で行った。これはニコニコ生放送でも中継され,約10万視聴者を集めることになる。
イシイ氏は,「人狼」を「人に見せる」ことで,ゲームに対する取り組み方が変わったという。ゲームだから勝ち負けは重要だが,人に見せる以上,それよりも「展開を面白くする」ことを意識するようになったというのだ。例えば,負けるのであれば,思い切り無様に,華々しく負けたほうが,見ているほうは面白い。
これは,「人狼」が従来とは異なる,新しいエンターテイメントになり得ることを示唆している。そして氏は,「そこまで含めて,人工知能が人狼を『プレイ』できるようにならないだろうか」と提案した。
AIが人狼で人間に勝利するのはいつか?
発表がひととおり終わったところで,パネルディスカッションとなった。
最初に大きな論題となったのは,「戦略の変化」である。
イシイ氏の場合,かつてはゲームデザイナーとして,「人狼」をロジックで読み解こう,勝ち抜こうとしていたが,人狼TLPTのメンバーと人狼をプレイすると,彼らが「人間力」で押し切ってくるということに気づいたという。沈思黙考して理論的に説得力のある仮説を作っていると,人間力を発揮して派閥を作るという「積極的にしゃべる」戦略の前に,何もできなくなってしまうのだそうだ。
また,その「人間力を駆使する」人狼TLPTにおいてもまた,その内側での戦略の高度化は続いている。プレイヤーのレベルがある程度まで揃っている環境において,「人狼」は次々に新しい戦略が作られるゲームとなるのだ。
この「戦略の変化」について,稲葉氏は「戦略がどこに行くのか興味がある」と語る。どこか究極の戦略に行き着くのか,それとも戦略がブームのように循環するのか。はたまた,この戦略に対してはこの戦略が有効,という形で発散していくのか。
これに対し大澤氏もまた,発散するのかどうかに興味があるとしつつ,「循環」の可能性にも着目する。というのも,社会的知能においては,なにか一つ定石ができると,それを裏切ることがメリットになり得るからだ。そして,定石を裏切ることのメリットが定着すると,さらにそれを裏切ることがメリットとなっていく。「人狼」の戦略もこうなっている可能性はあって,この場合AIは,単に定石を探索するだけではなく,「流行に追いついていく」ことも求められる。これについて氏は,「流行に追いつけることが知性」と語った。
続いての大きなテーマは,松原氏から投じられた。ズバリ,「人狼知能が人に勝利するのは何年後か」というテーマである。
稲葉氏は「人工知能の世界では,50年前から『50年後にはものすごい人工知能ができる』と言われていて,今も『50年後にはすごい人工知能ができる』と言っている。だから50年後と言っておけばお茶を濁せるのでは」と言いつつも,今の条件であれば10〜15年後,自然言語まで落とさずに「人狼」をシミュレートしたプロトコルで戦うのであれば5年程度という見解を示した。
大澤氏は,統計的手法による解析は進むだろうし,オンラインのログから最適戦術を見つけることも可能ではないか,と推測する。そのうえで稲葉氏同様,自然言語を使わなくていいなら5年くらい,と予測した。
ただし,この5年後の勝利は,ゴールではあり得ず,むしろスタートラインであるとも氏は指摘した。というのも,AIに負けた人間が,ここから本気でAIと戦うようになるからだ。
発表同様,熱のこもったパネルディスカッションだったが,最後に松原氏は「勝つことではなく,魅せることがプロであるとすれば,AIの最終的な目標もそこであるべきだ。人間に勝つAIではなく,人間を楽しませるAIでなくてはならない。人工知能はあくまで道具であって,人間に勝って勝ち誇るためのものではない。そういう意味でも,人狼は良い題材と言える」と語って講演を終えた。
かつてCEDECで「AIにとって将棋は,人間を打ち負かすというフェイズは実質終わっていて,いかに人間を楽しませる将棋を打てるかを模索するフェイズ」と語った松原氏だけに,これから人狼知能がどう育っていくのか,注目したい。
- この記事のURL:
- Intel,新世代モバイルCPU「Core M」プロセッサ計3製品を発表。ファンレスタブレットで新生FFXIVが遊べる時代が来る?
- 「ダンジョンを探索する」というリアルな感覚。「東京新世録 オペレーションアビス」のレビューを掲載
- まさにハック&スラッシュ! 敵をなぎ払う爽快感に酔いしれる「セイクリッド3」をプレイムービーで紹介
- [CEDEC 2014]PS4の作り方教えます。SCEのメカ設計担当者自らが内部構造を徹底解説
- 【山本一郎】それぞれのモンケン。クラウドファンディングのあした
- 「天と大地と女神の魔法」大型アップデートが近日実施予定。「おてんば暴君 ディディ」を始めとする新ロード3体や,新マップなどが追加に
- 「シェルノサージュ OFFLINE」と「アルノサージュ PLUS」の紹介動画が公開に。両タイトルの変更点や追加要素を解説
- [CEDEC 2014]日本が売上をけん引するスマホゲーム市場の最新事情。App Annieによるセッションの聴講レポートを掲載
- コーエーテクモゲームスが「東京ゲームショウ 2014」のブース内容を発表。「ブレイドストーム」「DEAD OR ALIVE」の最新作はプレイアブル出展
- 独「COUGAR」のゲーマー向け周辺機器が日本上陸。第1弾製品はキーボードとワイヤードマウスに