Deep “Reinforcement” Learning for Games

概要

AIが普及した世界を想像しましょう。
街には自動運転カーが普及し、AIのゲームプレイヤーがチャンピオンになる――。
画像認識で世界を席巻したDeep Learning は、こうした AIの実現にも役立つのでしょうか。

答えはYesです。そのポイントが、ロボットやゲーム AIで期待されている「強化学習」です。Deep Learningの技術は、強化学習の世界に進出し、AlphaGoやDeep Q-Network (DQN)を初めとする技術でブレークスルーを起こしました。

この講座は、Deep Learningの基礎を理解している学生を対象とした、Deep Learningを用いた強化学習に特化した全6回・約2週間のサマースクールです。東京大学Deep Learning基礎講座・応用講座を公開してきた松尾研究室が全面的に演習コンテンツを監修・作成しています。
実践的な演習を通して、効率的に学習を進め、手を動かしながら技術を深く理解し、幅広いトピックを網羅します。それによって、Deep Learningを用いた強化学習研究のスタートラインに立てるレベルの知識・実装力の習得を目指します。

ロボットの世界を理解するために、まずはソフトウェアの世界――ゲームAIの作成を行います。具体的には、FightingICEという格闘ゲームを用いた講義を行います。最終日にはYouTubeタレントを呼んで、皆さんが制作したAIを使ったトーナメントの模様を実況・放送します。

1受講者 – 1GPUサーバ

全ての受講者に一人一台の独立した仮想GPUサーバが割り当てられます．受講中は他の受講者の影響を受けることなく学習を進めることができます。

ブラウザのみ必要

必要なものはWebブラウザのみです。ブラウザを通じてGPUを利用したPythonプログラミングが可能な開発環境「iLect.net」が提供されます。クリック操作のみで演習を開始することができます。

構築済み環境

必要な全てのDeep Learning・機械学習ライブラリがインストールされ、構築済みの環境が配布されますので、すぐに学習を開始し本題に集中して取り組むことが可能です。

演習中心で効率良く短期習得

本プログラムの最大の特徴の一つは、全てのトピックについて，演習を中心に構成されている点です。実際に手を動かしながら理解を進めることで、効率よく学習することができます。

モデルの学習

Deep Learning技術では、モデルが学習する様子を観測しながらパラメータを調整することで、アプリケーションに応じたパフォーマンスの最大化を図ることが非常に重要です。この一連の流れを全ての演習で経験することで、重要な要素を身につけられます。

松尾研究室がコンテンツ作成

実践型のデータサイエンティスト育成講座およびDeep Learning講座を4年以上公開運営し、のべ千人以上の人材を育成してきた東京大学松尾研究室がコンテンツを監修・開発しました。

各講座

第1回導入

深層学習の基礎（Deep Learning, CNN, RNN, 最適化問題）、FightingIceの説明、ルールベースAI

第2回強化学習の基礎

エージェントと環境、MDP、テーブル法、価値関数法・方策反復法への導入

第3回価値関数法（DQN）

価値関数法（DQN）

第4回方策勾配法、分散学習（A3C）

方策勾配法、分散学習（A3C）

第5回実装Day

第6回トーナメント（一般公開）

企画・運営

東京大学

東京大学

大澤昇平

東京大学

大学院工学系研究科

講師

大澤昇平

東京大学

大学院工学系研究科

日程

募集開始	2018/7/3（火）
募集締切	2018/7/25（水）
選考結果	2018/7/31（火）
修了証発行	2018/10 予定

第1回	2018/9/12（水）13〜15時
第2回	2018/9/14 （金）13〜15時
第3回	2018/9/18 （火）13〜15時
第4回	2018/9/20（木）13〜15時
第5回	2018/9/21（金）13〜15時
第6回	2018/9/22（土）13〜15時