20180305_ppl2018_演繹から帰納へ～新しいシステム開発パラダイム～

演繹から帰納へ
～新しいシステム開発パラダイム～
3/5, 2018
Preferred Networks, 丸山宏
PPL2018招待講演

自己紹介:
 1983 東京工業大学修士課程修了
– （米澤明憲先生の下で）論理型言語、自然言語処理
 1983-2009 日本IBM東京基礎研究所
– 形式言語理論、構文解析、全文検索、手書き文字認識
– 分散処理（XML、Webサービス...

人工知能とは「CSを進化させる営み」
1956-1974 第1次人工知能ブーム
• 記号処理 (LISP)
• Means-End Analysis
• 自然言語処理
1980-1987 第2次人工知能ブーム
• 知識表現 (e.g. フレーム...

Software 2.0?
https://petewarden.com/2017/11/13/deep-learning-is-eating-software/

深層学習とは何か – (状態を持たない*)関数
Y = f(X)X Y
超多次元、（連
続変数・カテゴ
リ変数の任意の
組み合わせ）
判別・制御なら
ば比較的低次元、
生成ならば超多
次元
*推論時にパラメタ更新を行うオンライン学習についてはこ...

普通の関数の作り方: 例摂氏から華氏への変換
double c2f(double c) {
return 1.8*c + 32.0;
}
入力: C
出力: F
ただし、FはCを華氏で表したもの
仕様
アルゴリズム
F = 1.8 * C +...

深層学習のやり方 – 訓練データを用いる
訓練データセット
観測
訓練（ほぼ自動でパラメタθを決定）

機械学習（＝統計モデリング）すると…
モデル：線形回帰式
モデル・アルゴリズムが未知でよい

機械学習における、モデル選択の重要性
過学習に陥らずに、適切なモデルを選ぶには？
この訓練データ
をよく再現する
モデルは？
パラメタが多す
ぎると過学習に

先ほどの例を深層学習で訓練してみると…
…
…
出力Y
入力X
2層10ノード
の中間層
合計141個の
パラメタ
程よい近似
各ノードの入力は線
形結合。活性化関数
はランプ関数
ロス関数は平均2乗
誤差。これを逆伝搬
することで学習
モデル...

汎用計算機構としての深層学習
 桁違いに多いパラメタ
– 任意の多次元非線形関数を近似可能*
 疑似的にチューリング完全！
出力（超多次元）
入力（超多次元）
* G. Cybenko. Approximations by superpos...

訓練はどのように動くか (Facebook Yann LeCunによる動画)
https://code.facebook.com/pages/1902086376686983

自動運転のためのセグメンテーション
https://www.youtube.com/watch?v=lGOjchGdVQs
モデルが不明：人手による正解アノテーション(1)

ロボットビジョン：
Amazon Picking Challenge 2016 2nd Place in the Picking Task

音声によるロボットのコントロール

Consumer Electronics Show (CES) 2016
CESにおける自動運転デモ
アルゴリズムが不明：逆問題として定式化(1)

強化学習によるシステム開発
https://research.preferred.jp/2015/06/distributed-deep-reinforcement-learning/

線画への自動着色アプリPaintsChainer
アルゴリズムが不明：逆問題として定式化(2)

統計的機械学習の本質的限界 (1)
訓練データ
モデル
将来が過去と同じでないと正しく予測できない
時間軸
過去に観測されたデー
タに基づいて訓練
訓練
訓練済みモデルに基いて
新しい値を予測

 訓練データに現れない、希少な事象に対して無力
訓練データセット
内挿
外挿
??
機械学習はひらめかない、臨機応変な対応をしない

 本質的に確率的
元分布
独立・同分布(i.i.d.)
訓練データ
学習済みモデル
サンプリングに
バイアスが入る
ことは避けられ
ない！

深層学習とは何か（まとめ）
 関数（プログラム）の作り方
– 演繹でなくて帰納
 モデルやアルゴリズムがわからなくても、訓練データセットがあれば
作れる
– 教師信号の与え方次第で、驚くようなことが…
 本質的に統計モデリング
– 元分布...

新しいプログラミングパラダイムとしての
深層機械学習

典型的な機械学習応用システム
収集
前処理
訓練
推論
前処理
入力
正解データ
出力
訓練済みモデル生データ
収集
訓練データ
入力
推論パイプライン
訓練パイプライン

訓練誤差と汎化誤差
未学習領域
• モデルの複雑
さが足りない
過学習領域
• モデルを簡単化する
• 汎化テクニックを使う
• 訓練データを増やす
Daniel Beckstein, “Practical Methodology”, Cha...

Assessment PoC Pilot Deployment Maintenance
• お客様の理解度
• ビジネス目標
• 機械学習への適
合度
• データの入手可
能性
：
• データの量・
品質は足りて
いるか
• 期待する精度
が達...

課題(1)品質: 機械学習システムは、高金利クレジット！
• CACE (Changing Anything Changes
Everything) 原理 – すべてが絡み合っている
https://static.googleuserconte...

深層学習におけるテスト：データの分割と、漏れ
データ
セット
訓練用データ
汎化性能テスト
用データ
評価用データ
評価
訓練
訓練済みモデルX
評価用データの情
報が、訓練に使わ
れてはならない

確率的なシステムに対する社会受容？
Wall Street Journal, 7/7, 2016
http://jp.wsj.com/articles/SB11860788629023424577004582173882125060236
テス...

典型的なバグ密度（アセンブラ相当1,000行あたりのバグ
数)
http://www.softrel.com/Current%20defect%20density%20statistics.pdf

品質指標 – 多くの場合プロセス品質指標
http://www.ipa.go.jp/files/000028859.pdf
この車の安全性は？
例：どのくらいレビュー
に時間を割いたか？

第3者による客観的な品質指標の可能性
非公開の評価用データ
自動化された、第3者による評価
評価
評価結果のみ
を返す
この車の安全性は？

課題(2)再利用：訓練済みモデルの再利用パターン
同タスク
新タスク
同タスク
2. Fine Tuning
White box再利用
1. Copy
:
4. Distillation
Black box再利用
同タスク
3. Ensembl...

訓練済みモデルフォーマットの標準化(1)
訓練
https://www.khronos.org/nnef
推論

訓練済みモデルフォーマットの標準化(2): ONNX
message ModelProto {
optional int64 ir_version = 1;
:
optional GraphProto graph = 7;
};
message...

課題(3)アーキテクチャ・パターン：
モデルベース開発か、モデルフリー開発か？
モデルベース開発
（演繹的）
モデルフリー開発
（帰納的）
• モデルがよく知られている
• モデルを明快に書き下せる
• モデルと現実世界のギャッ
プが小さい
•...

B-TreeをDeep Learningに置き換える
https://www.arxiv-vanity.com/papers/1712.01208v1/
Keyから
アドレス
の予測
予測モデル
をDNNに置
き換え

AlphaGoは離散的な木探索とDLの融合
Silver, David, et al. "Mastering the game of Go with deep neural networks and tree
search." nature 5...

難しい問題の解法：非決定的探索問題としての定式化
探索オラクル
NP困難問題に対する新しいアーキテクチャ・パターン

課題(4): PPLコミュニティの方に考えていただきたいこと
1. 多次元の “Shape” を対象とした型システム
2. 機械学習システムの訓練速度、推論精度、推論速度、モニタリングなど
クロスカッティング・コンサーンを表現できるプログラミング

2/27「機械学習・ディープラーニングでPythonを使う嬉しさ
とツラミを分かちあう会」でのPFN酒井さんのプレゼン
https://www.slideshare.net/sakai/mlxse20180227-python

https://www.slideshare.net/sakai/mlxse20180227-python

“Programming by Optimization” の考え方
パラメト
リックな
ソース
Weaving
ドメイン依存
の入力分布
最適化ツール
Hoos, Holger H. "Programming by optimization....

“Instrumentation” の重要性
概念ドリフトの
モニタリング
推論精度の
モニタリング
訓練ハイパーパ
ラメタの設定
前処理パラメタ
の設定
「推論精度」「学習速度」「モニタリ
ング」などをクロスカッティング・コ
ンサーンとするW...

終わりに：AI人材不足論
7/31/2017 MONOist
http://monoist.atmarkit.co.jp/mn/articles/1707/31/news037.html

いつか来た道：ソフトウェア危機 (1960年代)
 ソフトウェア工学の夜明け

ソフトウェア科学会「機械学習工学研究会」が発足します！！
ソフトウェア科学会
機械学習工学研究会
5/17、学士会館にて
キックオフシンポジウム開催！

20180305_ppl2018_演繹から帰納へ～新しいシステム開発パラダイム～

Preferred Networks & Preferred Infrastructure

20180305_ppl2018_演繹から帰納へ～新しいシステム開発パラダイム～