カスタム検索
表示順:
Relevance
Relevance
Date
ウェブ
 
 
 

Google、TensorFlowベースの強化学習フレームワーク「Dopamine」(ドーパミン)、オープンソースで公開。脳の報酬系をインスパイヤ

2018年8月31日


機械学習のアルゴリズムのひとつである「強化学習」は、コンピュータが行動を選択した結果なんらかの報酬を得るとき、選択を繰り返していくなかでできるだけ多くの報酬を得るように学習していく、というものです。

この強化学習は、プロ囲碁棋士を破った初めてのコンピュータプログラムとなった「アルファ碁」で用いられたことで一気に注目されるようになりました。

Google Brainチームは、TensorFlowをベースにした強化学習のための新しいフレームワーク「Dopamine」(ドーパミン)をオープンソースで公開しました。

Dopamine

Dopamineは、下記のように脳の報酬系からインスパイヤを得たと説明されています。そしてドーパミンは人間にとっての報酬系である快感に関わる脳内物質のひとつとしてよく知られていますので、それにちなんでフレームワークの名前として採用されたようです。

Inspired by one of the main components in reward-motivated behaviour in the brain and reflecting the strong historical connection between neuroscience and reinforcement learning research, this platform aims to enable the kind of speculative research that can drive radical discoveries.

脳の報酬系の振る舞いの主要な要素にインスパイヤされ、また神経科学と教科学習の研究の歴史的な強い結びつきを反映して、このプラットフォームは大いなる発見を主導するような画期的な研究の実現を目指しています。

Dopamineが作られた背景には、これまでの強化学習フレームワークには柔軟性や安定性を両立させるようなフレームワークがなく、そのためにさまざまな強化学習をなんども繰り返して研究することが難しかったからだと説明されています。

そのため、Dopamineは簡単に試すことができ、柔軟に開発でき、コンパクトで高信頼、再現可能な以下の4つの特長を備えています。

また、新しいアイデアに対してベンチマークを取りやすいように、あらかじめベンチマーク用のデータも用意されています。

follow us in feedly


≪前の記事
2017年の国内サーバOS市場、Windows Serverが52%、Linuxが24.8%。クラウドによりLinuxが高成長を維持。IDC Japan


カテゴリ



Blogger in Chief

photo of jniino Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

人気記事ランキング

  1. AWSの仮想プライベートサーバ(VPS)「Amazon Lightsail」が料金改定でほぼ半額に。メモリ16GB、32GBのインスタンスサイズも新設
  2. [速報]Amazon RDS on VMware発表。オンプレミスのVMware環境でもAmazon RDSを提供へ。Oracle、SQL Server、MySQLなど対応。VMworld 2018 US
  3. 2017年の国内サーバOS市場、Windows Serverが52%、Linuxが24.8%。クラウドによりLinuxが高成長を維持。IDC Japan
  4. 全世界のIaaSクラウド、AWSが50%越えでシェアトップ、マイクロソフトは1年でほぼ倍増。アリババも急成長。ガートナー
  5. VMware Cloud on AWS、数千台規模のVMをダウンタイムなしでオンプレミスからクラウドへライブマイグレーション。新機能「VMware Cloud Motion」発表
  6. 米ガートナー、先進テクノロジーにおけるハイプサイクル2018年版を発表。汎用AIは黎明期、バイオチップやディープラーニングは過度な期待、複合現実は幻滅期へ
  7. 米ガートナー、先進テクノロジーにおけるハイプサイクル2018年版を発表。汎用AIは黎明期、バイオチップやディープラーニングは過度な期待、複合現実は幻滅期へ
  8. 来月にはJava 10が登場し、9月にはJava 11が登場予定。新しいリリースモデルを採用した今後のJava、入手方法やサポート期間はこう変わる(OpenJDKに関する追記あり)
  9. 仮想化基盤の新フラグシップ「VMware vSphere Platinum」発表。機械学習などでセキュリティを強化。VMworld 2018 US
  10. 「サーバレス/Serverless」はデータベースやコンテナへも広がってきた


新着記事 10本


PR - Books


fig

fig

fig