はじめに
ネットワーク解析やグラフアルゴリズムの研究者がアルゴリズムを実装した際,動作確認のために最初に実行する toy example をどうするかというのは意外と悩ましい.パスグラフやグリッドグラフのような高い対称性を持つグラフや小さすぎるグラフではいまいち動作に確証が持てない.一方,公開されている実データは最も小規模な Karate Club や Dolphin Social Network 等でも目視には大きすぎる.調度良いサイズの,ある程度非自明な形をしており,アルゴリズムによる出力の意味の解釈がある程度可能であり,できれば愛着が持てるグラフデータが必要とされている.
そこで,本研究ではそのような用途に適切なグラフデータとして,「ラブライブ! School idol project」のキャラクター間のグラフを構築する.データの構築には,Pixiv に投稿されている二次創作作品のタグの情報を用いる.
データの取り方
Pixiv API を叩き「にこまき」「りんぱな」といったようなタグに関する情報を用いてキャラクター間の関係(の人気)を推定する.値としては,そのタグを含む作品の観覧数の和を用いる.カタカナへの表記揺れは加味.
順番を加味しない場合
つまり,「にこまき」と「まきにこ」を同一視する場合.
行列
↑まずは 9 人.「にこまき」の人気が桁違いであることが定量的に示された.
↑A-RISE と妹2人を入れた 14 人版.「ありうみ」「ツバほの」がメインキャラ同士に匹敵する人気を誇ることが分かる.あと,意外にも「ツバゆき」なんていうマニアックそうなペアに非 0 の値が入っていることがわかる.
グラフ
私の事情により重み無しグラフが欲しいので重みなしグラフをこの行列より作る.単純にしきい値を指定しそれ未満の辺をミトメラレナイワァとする.
↑まず,観覧数 1,000,000 未満のペアがミトメラレナイ場合.生徒会グループとそれ以外(広義の1年生)に完全に別れた.広義の一年生側は完全にパスになってしまった,まるであまり仲が良くないかのようである.
↑次に,観覧数 100,000 未満のペアがミトメラレナイ場合.ツバサとイモーチカも登場.真姫の次数が高い.
順番を加味する場合
女性キャラクター同士の場合はカップリングを呼ぶ際の順番は重要ではないという主張が主流ではあるものの,有向グラフも欲しいし,試しに順番も加味してみることにした.即ち,「にこまき」と「まきにこ」を別扱いする.
行列
↑各セルは「行+列」の順のタグでのスコアを表す.意外と両方の順番で観測されるペアというのが結構ある.もっとも,両方の順番でタグが付加されている作品が一定数ある.