Chainer, Cupy入門

Chainer, Cupy⼊⾨
2016/07/02 Chainer Meetup #03
（株）Preferred Networks
海野裕也
v1.10向け

今⽇のおはなし
l  Deep Learningのおさらい
l  Chainer の使い⽅の紹介
l  CuPyの使い⽅の紹介
2

ニューラルネットの基礎

ニューラルネット
l  値が伝播していく有向グラフ
l  エッジで重みをかけて、ノードに⼊るところで⾜し
込み、ノードの中で⾮線形変換する
l  全体としては巨⼤で複雑な関数を表す
4

ニューラルネット＝合成関数
l  ベクトルに対して線形・⾮線形な関数をたくさん適
⽤する合成関数と捉えるとよい
l  各ノードはベクトルを保持する変数
5

⼀般のニューラルネットは DAG = 計算グラフ
⼀般にはグラフが分岐したり合流したりする
l  分岐：同じ変数を複数の場所でつかう
l  合流：⼆つ以上の変数を受け取る関数を適⽤する
6

計算グラフの例
z = x ** 2 + 2 * x * y + y
7
x
y
_ **
2
2 * _ _ * _ _ + _ z
_ + _

誤差逆伝播は、計算グラフを逆向きにたどる
計算グラフと順伝播時の各変数の値があれば計算可能
8

機械学習（教師あり学習）のおさらい
⽬的
l  ⼊⼒Xに対して出⼒Yを予測する関数fを求めたい
l  例：Xがメール、Yはスパムか否か
⽅法
l  正解のわかっているデータx1, y1 … xn, ynに対し
て、f(xi)とyiがなるべく⼀致...

機械学習のおさらい
多くの機械学習⼿法は、
1.  ⽬的関数の設計
2.  勾配の計算
3.  最⼩化のための反復計算
からなる
10
先ほどの計算は
ここに使う

ニューラルネットの学習⽅法
1.  ⽬的関数の設計
l  計算グラフを⾃分で設計する
2.  勾配の計算
l  誤差逆伝播で機械的に計算できる
3.  最⼩化のための反復計算
l  勾配を使って反復更新する
11
１さえ設計すれば残りは
ほぼ...

Chainer はニューラルネットのフレームワーク
l  機能
l  ニューラルネットを記述する
l  ニューラルネットの順伝播・逆伝播を実⾏する
l  勾配法を実⾏してパラメータを最適化する
l  Chainer の特徴
l  順伝播は単純に...

Chainer のインストール
l  環境は Linux（特に Ubuntu）がおすすめ
l  インストール⽅法
l  新しめの Python 環境を⽤意（CPython 2.7+, 3.4+, 3.5+）
l  pip も⽤意
l  コマンド...

順伝播
l  今まで「変数」と呼んでいたものは、Chainer
では Variable オブジェクト
l  Variable を Function に⼊れると、順伝搬後の
Variable が返ってくる
l  Variable が計算グラフを保...

順伝搬とコード例
16
x
y
_**2
2*_ _*_ _+_ z
_+_
x = Varaible(...)
y = Variable(...)
z = x ** 2 + 2 * x * y + y

Variable オブジェクト
l  計算グラフの（データ）ノード
l  NumPy または CuPy（後述）の配列を保持する
l  初期化時に配列を渡す
l  data 属性に保存される
l  多くの Function は配列の最初の軸をミニ...

Function オブジェクト
l  計算グラフの「演算」ノード
l  chainer.functions (以降 F) にいろいろ定義され
ている
l  F.relu, F.max_pooling_2d, F.lstm, ...
l  Fun...

Link オブジェクト
l  パラメータ付きの関数
l  最適化の対象となる
l  save/loadができる（v1.5からsave/loadをサポート）
l  chainer.links（以降L）に⾊々⽤意されている
l  L.Linear,...

ChainでLinkをまとめる
l  ⼀般的にパラメータ付きの関数（Link）は複数あるので、
Chainでまとめて管理できる
l  Chainを継承すると再利⽤しやすくなる
model = Chain(embed=L.EmbedID(1000...

ロス関数、勾配計算
l  ロス関数もFunctionの⼀種
l  ロス関数の出⼒に、Variable.backward() を呼ぶと
勾配が計算できる
loss = F.softmax_cross_entropy(y, t)
loss.back...

Optimizer の設定
l  勾配が計算できたら、あとは勾配法をまわす
l  勾配法のアルゴリズムは Optimizer クラスの⼦クラス
l  chainer.optimizers に定義されている
l  実装されている最適化⼿法：SGD...

Optimizer による最適化
l  まず勾配をゼロ初期化：zerograds()
l  順伝播・逆伝播を実⾏
l  最適化ルーチンを実⾏：update()
l  以上を何回も繰り返す
model.zerograds()
loss = ......

Chainer を使う場合の全体の流れ
1.  Linkを使ってChainを定義する
2.  Optimizer に、Chain を設定する
3.  forward 関数を定義する
4.  データセットを読み込み、訓練⽤と評価⽤にわける
5. ...

CUDAによる⾏列ライブラリCuPy
25

CuPyとは何か？
NumPy互換インターフェースの
CUDA実装の⾏列ライブラリ
26
Pythonの⾏列ライブラリ
NVIDIA GPUの開発環境とライブラリ

既存のライブラリと
同じインターフェースで
GPUの⾼速性を⼿に⼊れられる
27

CuPyとNumPyの⽐較
import numpy
x = numpy.array([1,2,3], numpy.float32)
y = x * x
s = numpy.sum(y)
print(s)
import cupy
x = cup...

CuPyはどのくらい早いの？
l  状況しだいですが、最⼤数⼗倍程度速くなります
def test(xp):
a = xp.arange(1000000).reshape(1000, -1)
return a.T * 2
test(numpy)...

なぜCuPyが求められるのか？
l  GPUを使った応⽤研究では、必
要な知識が以前より増えた
l  GPU⾃体が複雑
l  GPUを効率的に扱うアルゴリズム
も複雑
l  使わないと効率で勝てない
l  GPUを効率的に⼿軽に使える仕
組みが...

裏の仕組み
l  CUDA⽤ソースを⾃動⽣成してコンパイラが⾛る
l  ⽣成されたバイナリをGPUに⾃動的に転送・実⾏する
l  ビルド結果はキャッシュされるので２回⽬移⾏⾼速
31
スタブ
スタブ
実処理
nvcc
コンパイラ
.cubin...

⾃分でコードを書きたい時
例：z[i] = x[i] + 2 * y[i] を書きたい
32
引数の型: “float32 x, float32 y”
戻り値の型: “float32 z”
処理: “z = x + 2 * y;”
ループやイ...

チューニングの⽅法
l  CUDAのツールがそのまま使える
l  NVIDIA Visual Profiler (nvvp)やnvprofコマンド
l  CPU⽤のプロファイラではGPUのボトルネックがわ
からないので注意
l  詳細はCUDA...

深層学習以外にも利⽤できる
l  既存のNumPyコードがほぼそのまま動く
l  既存の解析⼿法がそのままCUDA上で動く
l  NumPyのベクトルデータとの変換は1⾏
34

まとめ
l  ニューラルネットを（おもに実装⾯から）簡単におさら
いしました
l  Chainerは直感的なインターフェスで深層学習できるラ
イブラリ
l  CuPyはNumPyインターフェースでCUDAを使えるライ
ブラリ
35

Yuya Unno