読者です 読者をやめる 読者になる 読者になる

Line 1: Error: Invalid Blog('by Esehara' )

または私は如何にして心配するのを止めてバグを愛するようになったか

>> Zanmemo

あと何かあれは 「esehara あっと じーめーる」 か @esehara まで

オオギリダイバーという大喜利イベントに人工知能を持ちこんで参戦した話

今日のラーメン

f:id:nisemono_san:20160617125303j:plain

人工知能は人間がボドルネックだった

日曜日は、オオギリダイバーというイベントがあり、それに『大喜利β』という人工知能が参戦すると聞いてきたので、元エンジニアで、ふらふらと大喜利に参加していた身としては、そりゃ参加しなきゃいけないだろうということで、人工知能のメカ大喜利くんを持ちこんで参戦してきた。どういうイベントかというと、こういう奴。


オオギリダイバー“フォース”Ⅱ【2ndステージAブロック】サツマカワRPG vs 能登たわし vs アキヤマ vs 俺スナ

結論から言うと、惨敗。でも、惨敗の結果は、結構面白い。

人工知能が意味不明なボケをだして滑る、というところの惨敗の結果ではなかった。実際のところ、システム上では、観客席から見ていた身からすると、確実に「大喜利β」の打率というか精度は抜群だったように思う。

どこで負けたかというと、事前に人工知能用に出されたレギュレーションによるものだ。それは「お題発表後、「スタート」の合図で代答者が『大喜利β』にお題入力を開始」というものであり、これは自分のシステムでもそうだったが、人工知能においては、大きな足枷となった。

どういうことかというと、オオギリダイバーでは持ち時間制限のある2分間で勝負する。人間の打鍵はスムーズに打てたとしても、たかだか1分間に300文字となるので、100文字くらいのお題が出ると、それで大半を持っていかれることになる。

『大喜利β』はわからないが、少くとも自分が作っているものに関しては、お題を全文入れなくても良い(エンジニアの方はここを参照)ので、実はそのあたりでごまかしは効くんだけど、そこはフェアネスの精神、「大喜利β」が全部入力しているんだから、自分もちゃんと入力しなきゃというところで、ちゃんと入力していた。

たぶん、エンジニアとしても一般的な、そういう人工知能を研究している人にも面白い話としては、人工知能というのは、このような「どうやって入力するのか」に対して盲点になりやすい、ということだろう。最近なら音声入力があるわけだから、これを利用すれば一発だった可能性が高い。

エンジニアというのは、開発していると、どうしても「そのシステムに最適化したような入力」に最適化されていってしまう。フリーゲームが不当に難しくなる理由もそうなんだけど、「これが一番適切だ」と思うルールを勝手に作ってしまう。とすると、違う条件下ではうまく対応できなくなってしまう。なので、この敗因は凄く勉強になった。

機械の強み

というわけで、ほのぼのと観客として見ていたんだけど、いやー、やっぱり面白いなあと思う。皆面白かった。皆優勝。ここからは舞台裏というか、自分の大喜利観を含めた話になる。

これは知人に指摘されたことだが、大喜利におけるお題というのは、おそらくまず二つに分けられる。

まず一つが「What?」という「何」を問うものだ。例えば「主婦の悩み100位は?」とか、「火星で発見された意外なものとは?」みたいなお題がそれにあたる。

それに対して、「How? Why?」というのが来る。「How?」は「どのようにして」を問うものだ。例えば、「通なテンプラの食べ方」、「気弱すぎる寿司屋が客に言ったこと」がそれにあたる。「Why?」は「理由」を問うもので、「カミナリ親父が怒った理由」というものになる。

観客で見ていたり、事前にシミュレーションした結果、大喜利にはいわゆる「パワー系ワード」というものが存在しているのではないか、ということを考えていたりした。パワー系ワードとは、「それ出たらお題関係無しに面白いやん」というやつだ。

自分の人工知能は、このパワー系ワードにやたらめったら強い。

その理由というのが、大喜利サイトを循環し、お題と解答を大量に集め、そこからお題と解答の関連の高い単語をピックアップして結びつけるということをやっているためだ。例えば、「掃除」というのだと、「モップ」や「シーツ」という単語をピックアップしてくる。敷居は不明だが、さらに進めれば「バキューム」というのが出てくる。これは個人の感性によるが、「バキューム」は「掃除」の単語の結びつきを考慮すれば、かなり単語として面白いと思う。このようなパワーワードの詰みかさねによって決定していく。

これは機械にとってのレギュレーションの強みであるが、「『大喜利β』が提示した複数の答えの中から、代答者が答えを選出し、ボードに記入。」というのは、かなり強い。なぜなら、人間より機械のほうが圧倒的にサイコロを降る数は多い。人間だと、ボードを記入するときに手が止まってしまう風景もしばし見られたが、機械はサイコロを降り続けることができるため、とにかく投げ続けることができる。従って、長期戦には強い。

逆に、自分の人工知能が「How?」や「Why?」に弱いのは、文章を作る能力が試されるからだ。文章生成が関わる分野に関しては、人間は圧倒的に強い。哲学者のデカルトは、「動物は言葉を持たない」と言ったらしいけど、俺はさらに文章という部分に持っていきたい。やはり人間のオリジナリティは、お題に対して、あるストーリーを続けていける能力にあると見ている。

実際、オオギリダイバーの長文回答者の面白さを、人工知能で再現するのは、結構難しいと思う。

文章生成について

文章生成の方法についても、単純な統計的事実に基づき決定している。ボケを品詞に分類した場合、下のようになった。これは過去のブログに基づくものである。

5792    名詞
4549    名詞,名詞
4242    名詞,助詞,名詞
3576    名詞,助詞,名詞,助詞,動詞
2713    名詞,助詞,動詞
1553    名詞,助詞,名詞,動詞
1480    名詞,名詞,名詞
1203    名詞,助詞,動詞,助詞,動詞
1151    名詞,助詞,動詞,助動詞
1062    名詞,助詞,名詞,助詞,動詞,助動詞

つまり、単純に考えて、このあたりの単語を上手く生みあわせればなんとかなるのだが、これだけだと、人間と対決するには弱い。なぜなら、HowやWhyが来る可能性が強いからだ。なので、三つのセクションに分解し、随時「ああ、」とか「まあまあ」みたいな、感嘆詞を追加するパターンだったり、あるいは語尾に「だよ」「なんだ」みたいな語尾を付ける、みたいなことをやったりした。

人工知能と大喜利

というわけで、ざっくりとしたイベント感想でしたが、一年前ほどに大喜利をしていた人とも一緒に話すことができて楽しかったのは間違いなかった。あと、この分野を『大喜利β』に独占させるのは正直もったいないので、もっといろんな人工知能が出てきて欲しいなと思ったりした。

『大喜利β』はたぶん、うまい返しをしている。その一方で、こういう舞台大喜利では、個人の芸風みたいなのを作れれば勝てるみたいなものがあったりする。なので、自分はいち早く、「シュールな大喜利をする人工知能」という印象を植えつけたかったというのはあった。とはいえ、これに関しては、その前に負けてしまった。今後、こういうイベントが出てきたら、そういう風に、人工知能の芸風というのも生まれるだろうし、そのような多様性が生まれる余地は十分にある、と俺は睨んでいる。

ちなみに社会の厳しさです