Seamless

　Virtual Reality News

メニュー

Google DeepMind、AlphaGoに圧勝（100勝0敗）する新たな囲碁AIプログラム「AlphaGo Zero」を発表。囲碁の基礎ルールのみ教え3日間で500万回強化学習

2017.10.19
AI 論文

Google DeepMindは、囲碁の世界トッププロ棋士を破ってきたコンピュータ囲碁AIプログラム「AlphaGo」に圧勝する新たな人工知能プログラム「AlphaGo Zero」を論文にて発表しました。

Mastering the game of Go without human knowledge（PDF）

AlphaGoは、数千もの打ち手のデータを学習し強化しましたが、AlphaGo Zeroは、このステップをスキップし、答えなしの白紙の状態からランダムにプレイし強化学習する手法を取り入れます。

過去のデータからではなく、囲碁の基本ルールだけ教えて、あとはAI同士が教師なし学習で対局を繰り返すことで上達していく手法が採用されます。

そして、3日間で500万回の対戦を強化学習したところ、トップ棋士を破ってきたAlphaGoを、100勝0敗という圧倒的強さで打ち破ったということです。

また、それだけでなく、2000年前から存在していたとされる囲碁の歴史で人が編み出してきた定石と呼ばれる最善の石の打ち方を更新する、新たな定石も生成したと言います。

関連

Google「DeepMind」、コンピュータが人型ベースでB地点にたどり着く最善の方法（柔軟な動き）を独学で生成する強化学習を用いたアプローチを提案した論文を発表 | Seamless

シェアする

ワシントン大学、ロボットハンド等の指先に巻き付ける事ができる電子皮膚センサー「skin」を発表。人の指と同様の触覚感度でせん断力を測定する

トップページに戻る

About

Seamless（シームレス）は、Virtual Realityを主軸に更新しています。（詳細はこちら）

最近の記事

過去1週間の人気記事5

過去１ヶ月の人気記事10

過去半年の人気記事10