今日のラーメン
人工知能は人間がボドルネックだった
日曜日は、オオギリダイバーというイベントがあり、それに『大喜利β』という人工知能が参戦すると聞いてきたので、元エンジニアで、ふらふらと大喜利に参加していた身としては、そりゃ参加しなきゃいけないだろうということで、人工知能のメカ大喜利くんを持ちこんで参戦してきた。どういうイベントかというと、こういう奴。
オオギリダイバー“フォース”Ⅱ【2ndステージAブロック】サツマカワRPG vs 能登たわし vs アキヤマ vs 俺スナ
結論から言うと、惨敗。でも、惨敗の結果は、結構面白い。
人工知能が意味不明なボケをだして滑る、というところの惨敗の結果ではなかった。実際のところ、システム上では、観客席から見ていた身からすると、確実に「大喜利β」の打率というか精度は抜群だったように思う。
どこで負けたかというと、事前に人工知能用に出されたレギュレーションによるものだ。それは「お題発表後、「スタート」の合図で代答者が『大喜利β』にお題入力を開始」というものであり、これは自分のシステムでもそうだったが、人工知能においては、大きな足枷となった。
どういうことかというと、オオギリダイバーでは持ち時間制限のある2分間で勝負する。人間の打鍵はスムーズに打てたとしても、たかだか1分間に300文字となるので、100文字くらいのお題が出ると、それで大半を持っていかれることになる。
『大喜利β』はわからないが、少くとも自分が作っているものに関しては、お題を全文入れなくても良い(エンジニアの方はここを参照)ので、実はそのあたりでごまかしは効くんだけど、そこはフェアネスの精神、「大喜利β」が全部入力しているんだから、自分もちゃんと入力しなきゃというところで、ちゃんと入力していた。
たぶん、エンジニアとしても一般的な、そういう人工知能を研究している人にも面白い話としては、人工知能というのは、このような「どうやって入力するのか」に対して盲点になりやすい、ということだろう。最近なら音声入力があるわけだから、これを利用すれば一発だった可能性が高い。
エンジニアというのは、開発していると、どうしても「そのシステムに最適化したような入力」に最適化されていってしまう。フリーゲームが不当に難しくなる理由もそうなんだけど、「これが一番適切だ」と思うルールを勝手に作ってしまう。とすると、違う条件下ではうまく対応できなくなってしまう。なので、この敗因は凄く勉強になった。
#オオギリダイバー に関しては、やっぱり『大喜利β』の精度の強さは圧倒的だったのが一つ、あとお互いレギュレーションの「お題を合図と同時に入力しなくてはならない」で制限時間を吸い取られたので、最終的には入力インターフェイス(音声入力するとか)の問題であったので、そこをどうにかだった
— えせはら(似非原重雄) (@esehara) 2016年6月19日
機械の強み
というわけで、ほのぼのと観客として見ていたんだけど、いやー、やっぱり面白いなあと思う。皆面白かった。皆優勝。ここからは舞台裏というか、自分の大喜利観を含めた話になる。
これは知人に指摘されたことだが、大喜利におけるお題というのは、おそらくまず二つに分けられる。
まず一つが「What?」という「何」を問うものだ。例えば「主婦の悩み100位は?」とか、「火星で発見された意外なものとは?」みたいなお題がそれにあたる。
それに対して、「How? Why?」というのが来る。「How?」は「どのようにして」を問うものだ。例えば、「通なテンプラの食べ方」、「気弱すぎる寿司屋が客に言ったこと」がそれにあたる。「Why?」は「理由」を問うもので、「カミナリ親父が怒った理由」というものになる。
観客で見ていたり、事前にシミュレーションした結果、大喜利にはいわゆる「パワー系ワード」というものが存在しているのではないか、ということを考えていたりした。パワー系ワードとは、「それ出たらお題関係無しに面白いやん」というやつだ。
自分の人工知能は、このパワー系ワードにやたらめったら強い。
過去の動画を見ながら、自分の大喜利システムでシミュレーションしてるけど、「パワーワード系お題(『ハブが逃げてしまい、苦肉の策で始めた対決ショー。「○○ vs マングース」』)」なら、「ぷよぷよの赤色」「卒業アルバム」「田植えのヤカン」「肩書」というボケの余地になるものが出る。
— えせはら(似非原重雄) (@esehara) 2016年6月18日
その理由というのが、大喜利サイトを循環し、お題と解答を大量に集め、そこからお題と解答の関連の高い単語をピックアップして結びつけるということをやっているためだ。例えば、「掃除」というのだと、「モップ」や「シーツ」という単語をピックアップしてくる。敷居は不明だが、さらに進めれば「バキューム」というのが出てくる。これは個人の感性によるが、「バキューム」は「掃除」の単語の結びつきを考慮すれば、かなり単語として面白いと思う。このようなパワーワードの詰みかさねによって決定していく。
これは機械にとってのレギュレーションの強みであるが、「『大喜利β』が提示した複数の答えの中から、代答者が答えを選出し、ボードに記入。」というのは、かなり強い。なぜなら、人間より機械のほうが圧倒的にサイコロを降る数は多い。人間だと、ボードを記入するときに手が止まってしまう風景もしばし見られたが、機械はサイコロを降り続けることができるため、とにかく投げ続けることができる。従って、長期戦には強い。
今日、同居している人を掴まえて練習していたのだけど、素人の開発した人工知能が大喜利に勝つためには:
— えせはら(似非原重雄) (@esehara) 2016年6月18日
・選挙カーの松崎しげる
・ドン小西の実感
・蛭子能収のイェーイ
など、お題に関係無く面白いパワーワードで殴る必要があるのではないか、という結論が出たりしていた。
逆に、自分の人工知能が「How?」や「Why?」に弱いのは、文章を作る能力が試されるからだ。文章生成が関わる分野に関しては、人間は圧倒的に強い。哲学者のデカルトは、「動物は言葉を持たない」と言ったらしいけど、俺はさらに文章という部分に持っていきたい。やはり人間のオリジナリティは、お題に対して、あるストーリーを続けていける能力にあると見ている。
実際、オオギリダイバーの長文回答者の面白さを、人工知能で再現するのは、結構難しいと思う。
文章生成について
文章生成の方法についても、単純な統計的事実に基づき決定している。ボケを品詞に分類した場合、下のようになった。これは過去のブログに基づくものである。
5792 名詞 4549 名詞,名詞 4242 名詞,助詞,名詞 3576 名詞,助詞,名詞,助詞,動詞 2713 名詞,助詞,動詞 1553 名詞,助詞,名詞,動詞 1480 名詞,名詞,名詞 1203 名詞,助詞,動詞,助詞,動詞 1151 名詞,助詞,動詞,助動詞 1062 名詞,助詞,名詞,助詞,動詞,助動詞
つまり、単純に考えて、このあたりの単語を上手く生みあわせればなんとかなるのだが、これだけだと、人間と対決するには弱い。なぜなら、HowやWhyが来る可能性が強いからだ。なので、三つのセクションに分解し、随時「ああ、」とか「まあまあ」みたいな、感嘆詞を追加するパターンだったり、あるいは語尾に「だよ」「なんだ」みたいな語尾を付ける、みたいなことをやったりした。
人工知能と大喜利
というわけで、ざっくりとしたイベント感想でしたが、一年前ほどに大喜利をしていた人とも一緒に話すことができて楽しかったのは間違いなかった。あと、この分野を『大喜利β』に独占させるのは正直もったいないので、もっといろんな人工知能が出てきて欲しいなと思ったりした。
『大喜利β』はたぶん、うまい返しをしている。その一方で、こういう舞台大喜利では、個人の芸風みたいなのを作れれば勝てるみたいなものがあったりする。なので、自分はいち早く、「シュールな大喜利をする人工知能」という印象を植えつけたかったというのはあった。とはいえ、これに関しては、その前に負けてしまった。今後、こういうイベントが出てきたら、そういう風に、人工知能の芸風というのも生まれるだろうし、そのような多様性が生まれる余地は十分にある、と俺は睨んでいる。
真面目な話、囲碁も将棋も「勝敗」がはっきりしている中で戦う人工知能は結構あるが、大喜利みたいな「面白さ」という曖昧な基準を肉薄する人工知能が出ないのはもったいないし、そういう曖昧な基準を機械に落として表現するというのはもっと出てきてほしい、ドワンゴは早く電脳大喜利戦開催して欲しい
— えせはら(似非原重雄) (@esehara) 2016年6月19日
ちなみに社会の厳しさです
人間にも実績が求められますが、人工知能にも実績が求められ、ブレイクした人工知能と、ワナビーのままくすぶる人工知能が存在することになり、この話はやめましょう。
— えせはら(似非原重雄) (@esehara) 2016年6月18日