Learning Convolutional Neural Networks for Graphs

Learning Convolutional Neural
Networks for Graphs
Mathias Niepert, Mohamed Ahmed, Konstantin Kutzkov
秋葉拓哉 (Preferred Netwo...

⾃⼰紹介
l  名前：秋葉拓哉
l  Twitter, GitHub：@iwiwi
l  経歴：東⼤今井研 (博⼠) → NII (特任助教) → PFN (リサーチャー, 7/1 ⼊社!)
l  今年の戦歴：KDDʼ16, IJCAIʼ16...

論⽂概要
グラフを CNN に突っ込む
がほぼ全て！
課題
l  でも、突っ込み⽅が難しい
l  似た構造が似た突っ込まれ⽅をされてほしい
アルゴリズム概要
l  頂点を決まった個数選んで、その近傍を取り出す
l  ラベリングによる特徴付けを使...

背景
なぜグラフを NN に突っ込むのが難しいか？

グラフの分類
想定する状況
l  グラフが⼤量にある
l  分類をしたい
応⽤例
1.  化学化合物の作⽤を分類する
2.  分⼦（タンパク質）の空間構造から酵素か否かを分類する
3.  ⽂や⽂章の構造を分類する
本論⽂の実験では 1 と 2 ...

グラフの分類の難しさ
そもそもグラフが同⼀かを判定する
ことすら計算困難！（グラフ同型性判定問題）
6
(wikipediaより)
※ここで計算困難とは多項式時間アルゴリズムが見つかっていないという意味

グラフの分類の難しさ
信号や画像のようなデータと違う難しさ
l  ⼊⼒データで使われる頂点番号に意味が無い
l  頂点番号の置換に影響されない特徴を取りたい
7

既存研究：グラフカーネル
グラフ同⼠の類似度を測るグラフカーネルが使われてきた
⾊々なグラフカーネル
l  Shortest-Path Kernel
l  Random Walk Kernel
l  Graphlet Count Kernel
...

既存研究：Weisfeiler-Lehman Graph Kernel
9
[Shervashidze+, JMLR’11, Fig. 2]

10
近傍のラベルを集める

11
ラベルを振り直す

12
頂点のラベルを新しくしてしまう

13
これを繰り返した
最終的なグラフ
multiset
とみなす

⼊出⼒
l  ⼊⼒：頂点のみにラベルのついたグラフ（１つ）
l  出⼒： (w, k, a) のテンソル（→ CNN に突っ込む）
15
CNN

1.  頂点を w 個選んで順番をつける
2.  各頂点について近い頂点を k 個選ぶ
3.  k 個の頂点に順番をつける
4.  ならべる（w×k）
16

ステップ１：頂点を w 個選択し順番をつける
Weisfeiler-Lehman (WL) のラベルを使う
1.  WL のラベルで頂点をソート
2.  ⼩さいやつから順に w 個を選択
同じような近傍構造を持つ頂点を
テンソル内の同じような位...

ステップ 2：各頂点について近い頂点を k 個選択
ステップ 1 で選んだ各頂点 v について：
1.  N = v から距離 1 の頂点としてみて、|N| ≧ k なら終了
2.  N = v から距離 2 の頂点としてみて、 |N| ≧ k...

ステップ 3：k 個の頂点に順番を付ける
頂点 v とその近傍集合 N について：
1.  まず v からの距離で昇順ソート
2.  同じ距離のものは WL ラベルでソート
3.  N が k 個より多ければ top-k だけにする
19

ステップ 4：ならべてテンソルを作る
l  縦に w 個の頂点（ステップ 1）を並べる
l  横に k 個の頂点（ステップ 2&3）を並べる
l  各頂点の持つ属性が a 次元のベクトルとする
サイズ (w, k, a) のテンソルの完成！
こ...

アルゴリズム概要（おさらい）
1.  頂点を w 個選んで順番をつける
2.  各頂点について近い頂点を k 個選ぶ
3.  k 個の頂点に順番をつける
4.  ならべる（w×k）
21

理論的性質
Theorem 4：計算量
l  このアルゴリズムはほぼ線形時間で動作
Theorem 3：正当性（？）
l  グリッドグラフに適⽤すると、画像と同じく正⽅形が取られ、
画像に対する CNN と同じ挙動になる
という主張だと理解しま...

実験設定
提案⼿法：Pachy-san + CNN
l  w = 平均頂点数、k = 5, 10
l  3 層：畳み込み, 畳み込み, 全結合, softmax
1層⽬の畳み込みはフィルターが (1×k) でストライドが k → すっぽり各頂...

実験結果
PSCN：提案⼿法（Pachy-san+CNN)、PSLR：Pachy-san+ロジスティック回帰
雑な要約
l  精度：⾼い（常にそこそこ上位）
l  速度：速い（既存⼿法内で⾼速な WL よりも速い）
25

特徴の可視化
Pachy-san の出⼒を可視化したもの
26

細かいこと・関連研究

細かいこと
l  属性は離散でも連続でもいい
–  実はこれはグラフカーネル界隈的には重要
–  WL カーネル等のカーネルは離散でしか使えない
–  連続属性向けのカーネルは性能が劣る傾向にあった
l  頂点属性だけでなく辺属性も対応できる
...

細かいこと
連続な属性に関する実験
29

細かいこと
l  Weisfeiler-Lehman でグラフの同型性判定って解けてない？
→ 解けません！
30

細かいこと
l  ラベリングは Weisfeiler-Lehman でなくても良い
–  類似した頂点が類似した値を取るような指標であれば良い
–  次数、中⼼性、PageRank, ......
l  同じラベルになった頂点の tie-bre...

関連研究
l  Halting in Random Walk Kernels (NIPSʼ15)
–  Random Walk Kernel が理論的に微妙という話
–  阪⼤の杉⼭さん
l  DeepWalk: Online Learning...

関連研究
l  Eﬃcient Top-k Shortest-path Distance Queries on Large Networks
by Pruned Landmark Labeling (AAAIʼ15)
–  秋葉、林くん、則さん...

まとめ
グラフを CNN に突っ込む
課題
l  似た構造が似た突っ込まれ⽅になるようにテンソルにする
アルゴリズム
l  既存の特徴付け (Weisfeiler-Lehman) で順序を付けて並べる
実験結果
l  ⾼精度かつ⾼速
35

個⼈的な感想
l  前処理が多く、Weisfeiler-Lehman ラベリングにかなり頼っている
–  特徴の抽出はできるだけ NN に移譲したいが、グラフはやはり難しい……
–  とはいえこれまでのカーネルよりは NN に移譲できているとい...

Takuya Akiba