2012年3月に言語処理学会の年次大会で発表されましたこちらの論文、ここ最近ちょっとだけ自然言語処理、機械学習界隈で話題になっていたのですが、皆様ご存知でしょうか? 論文まとめサイトと化しつつある我がブログ、まあ取り上げますよね!
ポケモン論文は、実のところ数多くあります。cinii で検索するとけっこうありますね。しかしながら理系的なアプローチは珍しく、卒業論文「ポケモンつなげるもん♪ ―最長しりとり問題を整数計画法で解く―」だけが突出して有名です。この論文は、停滞した情報系ポケモン論文業界に一石を投じるものであります。
この論文、最初タイトル見たときは「どこのFランだよwww」と思ったのですが、Last Author である荒牧英治先生は自分と同じ大学の自分と同じ建物にいらっしゃることが分かり、急に真顔になりました。
さてさて内容です。
タイトルは『音象徴の機械学習による再現:最強のポケモンの生成』ですが、そもそも「音象徴」とは何か? 音象徴とは、音と指示対象の連想関係のこと、らしいです。ポケモンの場合は、「なんか名前的に強そう」とかそういう話になります。
論文中では、ブーバ/キキ効果の人が引用されてます。皆様ブーバ/キキ効果はご存知ですか?
上の画像、どっちかが「ブーバ」でどっちかが「キキ」です。さあどっちでしょう?
こう聞くと、大多数の答えが一致します。不思議ですね。(画像は wikipedia から。)このような音と図形の連想関係をブーバ/キキ効果と言う、という話です。今回はこれを、ポケモンの名前とその強さ、について考えます。
ここではふたつの実験を行います。ポケモンの名前と強そう感に連想関係があるのか? 機械学習によってそれが再現できるのか?
ポケモンの名前と強そう感に連想関係があるのか?
彼らは、ポケモン全然わかんない人を8人呼び出し、「ねえベロリンガとルージュラどっちが強そう?」みたいなことをそれぞれ300件聞きました。そして、人によってどっちが強いかって判断は異なるにせよ、7割程度は一致するという結果を得ました。
すごい実験ですね。
あとはこの結果を機械学習に放り込んで学習させ、機械にも同じような判断ができるようにします。
ポケモンの名前の「カタカナ/ローマ字」の「モノグラム/バイグラム」を単純に SVM に放り込んで学習します。すると、人間と7割ほど解答が一致する機械ができました。人間同士でも7割くらいしか強そう感は一致しないので、ほぼ人間と同等の強そう感判別力を持つ機械ができたことになります。
めでたい!
そのあと結果を分析します。
どうやら母音は /u/, /e/ が、子音は /d/, /g/, /r/, /s/, /j/ が強そう感に影響を与えることがわかるっぽいです。
さあ、ここから、彼らは最強のポケモンを作り始めます。
まず、先ほどの実験で強そうと判断されたポケモンの名前を抽出します。そして、1文字をランダムに変更します。それを機械に、強そうかどうか判断させます。どうやら強そうだと判断されたら、また1文字をランダムに変更します。これを繰り返すことにより、ポケモンの名前はどんどん強くなってゆきます。
同様にして最弱のポケモンも作ることができます。
そして得られたポケモン群が以下です。
最強ポケモン | 最弱ポケモン |
---|---|
ロフスムパ | ピゼシニボ |
ズルプケミ | ニツサヌザ |
デアイゼズ | ミツズヌモ |
クキメパヂ | メツテハプ |
ダドェイフ | ピンズリホ |
ブラセミグ | ナゾケモシ |
タトジゴク | ナナパモツ |
グテネミバ | ダナパォツ |
ヅラナミグ | ムテスンシ |
ゾラセクト | フゾポボフ |
最強のポケモン・最弱のポケモンできました。やったね!!
…ううん、分かる気もする?
「ゾラセクト」強そう。「ダナパォツ」弱そう。パォ。
以上、これで終わりです。
以下のことがわかりました。
素晴らしい研究ですね。僕もこういう研究して孫に自慢したい。
論文本文のダウンロードはここからできます。