2015-05-31
■ディープラーニングがなんなのか簡単に知りたい人はこれを読もう
Googleがディープラーニングを利用して写真を勝手に整理する機能を付けたことでディープラーニングが一気に身近に感じられるようになった。
僕も最近ブログでディープラーニングの話をすることが多いせいか、「ディープラーニングについて簡単に要約して教えて」と言われるんだが、そもそも人工知能の話は簡単に要約できるほど単純ではない。
僕だってニューラルネットとか、20年前から自分で実験したり作ったりしてたわけだから、そういう時代の流れを経験してないと本当のところは理解できないのではないかと思う。が、まあビジネスパーソンの皆様は結論だけ知りたがるのよね。結局、何ができるのって。
まあとりあえず読めば間違いないのはこの本
- 作者: 松尾豊
- 出版社/メーカー: KADOKAWA / 中経出版
- 発売日: 2015/03/10
- メディア: Kindle版
- この商品を含むブログ (8件) を見る
ではあるけれども、これすら長い、読むのがめんどくせーという人もいるみたいなので、ディープラーニングの原理ではなく、トレンドと概要だけざっくり掴みたいのであれば今月号の日経エレクトロニクスがいい。
松尾さんの本よりも技術的に踏み込んだ内容でありながら、現状の状況を図や表でうまく整理している。
なんか表がおかしい部分もあるけど(TorchとCuDNNが同列になっていたり)。
あと、似たような感じでライトに読めそうなのはこれ
The Next Technology 脳に迫る人工知能 最前線 (日経BPムック)
- 作者: 日経コンピュータ
- 出版社/メーカー: 日経BP社
- 発売日: 2015/04/16
- メディア: 単行本
- この商品を含むブログ (2件) を見る
ディープラーニングには何が出来て何が出来ないのか、ということをざっくり説明すると、まず学習と利用に分けられる。
ディープラーニングの典型的な利用例である画像の学習は上図のような形で行われる(技術的にはコンボリューショナルニューラルネットワーク等を使用する)。
有名なのは0から9までの数字を手書きしたパターンを無数に読み込ませて判別するMNISTというテストだけど、別にこれはなんでもいい。
同じ原理でなんでも学習できる。
ポイントは、予め分類されたデータを学習させておくと、ニューラルネットワークが勝手に特徴を学習していくれるということ。
この学習にはべらぼうな時間とメモリーが必要で、まあ自宅のパソコンでやるのは無理がある。
オシャンティーなMacBookあたりでかるーく学習させようと思ったら地獄を見る。一週間ブン回しても学習が終わらないという状況が容易にやってくるのだ。
高速なSSDとNVIDIAのGPU、最低でも16GB以上のメモリーを持ったマシンを使ってようやく初歩的な学習を実用的な速度で行うことができる。
次に、ニューラルネットワークを利用するときは下図のようなイメージになる。
学習済みのニューラルネットワークに、全く未知の(つまり学習してない)データを見せると、ニューラルネットワークはそれが過去に学習したどのタイプの分類に近いか推定する。
学習されたニューラルネットワークを利用するためには、そこまで高度なコンピューティングパワーはいらない。
iPhoneでも動くくらい
だから簡単にどんなことができるのか体験したければアプリをダウンロードすればいい
Democratizing deep learning with an iPhone app and open source SDK | Gigaom
今流行ってるディープラーニングは画像が主流(従来技術では画像認識が一番難しかった)だが、学習できるものは画像だけに限らない。
とにかくざっくりぼんやりしたデータを分類しておけば特徴を学習してくれるので、音声だろうがテキストだろうが学習できる。
Googleの画像判別は、画像認識のためのコンボリューションニューラルネットワーク(CNN)を前段に、それを文章化するためのリカレントニューラルネットワーク(RNN)を後段に持ってきている。
CNNに代表されるニューラルネットワークは内部状態を持たず、学習結果がネットワークそのものに保存される。つまり、ある時点のニューラルネットワークに同じ入力を与えれば常に同じ出力が返ってくる。
これに対し、RNNは内部状態を持ち、同じ入力を与えても文脈によって出力が異なる。
イメージ的にはCNNが数学上の関数に近い(同じ入力に対しては常に同じ答え)のに対し、RNNはコンピュータや動物に近い。
僕は単なるソフトウェアにお金を払う時代は20世紀に終わったと考えている。
21世紀の最初の10年は、ソフトウェアではなく体験に対してお金を払う時代になった。
ニコニコ動画がいい例で、ニコニコ動画では動画コンテンツそのものを販売してはいない。
動画を快適に見る権利だけが販売されている。
ではこれ以降の世界はどうなっていくのか。
2010年から2015年までは、ネット上の土地(つまりクラウド・ストレージ)を販売するビジネスを各社が展開し始めた。
iCloudしかり、Dropboxしかり、OneDriveしかり。
しかしついにGoogleが容量無制限の画像ストレージサービスを始めた。
ということは、これからの10年はどうなっていくのかというと、ひとつの仮説として、ニューラルネットワークだけが価値を持つ時代が到来するのではないかと思う。
なぜならニューラルネットワークを教育するには依然として膨大な計算資源とマンパワーを必要とするからだ。
Googleがかつて猫を認識するニューラルネットワークを作った時には、1000台のコンピュータと1億の費用が掛かったという。
今は同じことはもっと安くできるかもしれないが、それ以前にコンピュータが学習するためのデータセットを揃えるのは極めて大変である。
ここに単純だが膨大なマンパワーが必要となり、こうして得られたニューラルネットワークはその存在そのものが大きな財産になるだろう。
そしてニューラルネットワークは学習し続けることで価値を増していくことができる。
ニューラルネットワークを利用する場合にはある時点のニューラルネットワークのスナップショットをダウンロードすれば良いが、それが学習し続けるためには膨大な計算資源を維持する必要があり、ソフトウェアの本質的な価値は、そうしたニューラルネットワークが学習し続ける環境を維持することにのみ集約されていくのかもしれない。
そうすることによって、人工知能が本質的な価値を持つ時代がようやく到来する。
技術的特異点(シンギュラリティ)の到来が益々現実味を増してきた。
- 34 http://t.co/pnQONDWacq
- 6 http://b.hatena.ne.jp/
- 6 https://www.facebook.com/
- 5 http://pipes.yahoo.com/pipes/pipe.info?_id=7ed2910a6358c42a7305fae463b19704
- 4 http://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CFQQFjAG&url=http://d.hatena.ne.jp/shi3z/20150531/1433032775&ei=_FlqVezxG8735AaIIA&usg=AFQjCNErgbD4wmEI7QEiQtXvD_7pCE9oBA
- 4 https://www.google.co.jp/
- 2 http://t.co/fYNZsEPooK
- 2 http://www.google.co.jp/search?q=男子校+恋愛&inlang=ja&hl=ja&ie=UTF-8&prmd=ivns&ei=L1xqVcWGHsP98AWpmYLYAw&start=10&sa=N
- 2 http://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=0CDEQFjAD&url=http://d.hatena.ne.jp/shi3z/20150531/1433032775&ei=-llqVeXDFKu5kAauVw&usg=AFQjCNErgbD4wmEI7QEiQtXvD_7pCE9oBA
- 1 http://127.0.0.1:12108/sharpreader/page.html