Dynamic Routing Between Capsules

1. どんなもの?

Capsule構造とRouting-by-Agreementでアフィン変換に対してよりロバストになったCapsule Network(CapsNet)を提案.

2. 先行研究と比べてどこがすごいの?

Convolutional Neural Network(CNN)は画像認識において最先端のアプローチとなっているが,ある物体を他の視点からみたサンプルに対する予測精度は低い.これは予めアフィン変換を施した学習データを用いることで対処されるが,特徴量の学習は次元数の増加に応じて指数関数的に増加してしまい,効率が悪い.

先行研究で提案されているCapsuleは,ニューラルネットワークのある層がサブ構造を含むようなアーキテクチャを利用することで指数関数的な効率の悪さを抑えたものとなっている.

また先行研究で用いられているCNNは以下のような欠点が存在している.

本研究では計算効率の良いCapsule構造を取り入れ,非線形変換である「squash」,およびプーリング操作に変わりアフィン変換にロバストな「routing」からなるCapsule Networkを提案している.

3. 技術や手法の”キモ”はどこにある?

4. どうやって有効だと検証した?

5. 議論はあるか?

6. 次に読むべき論文はあるか?

論文情報・リンク