パスワードを忘れた? アカウント作成
13289896 story
ゲーム

囲碁世界レーティング1位の柯潔九段とAlphaGoが対局、第1局はAlphaGoが勝利 15

ストーリー by hylom
さてどうなるか 部門より
あるAnonymous Coward 曰く、

現時点でGoRatings.orgによる囲碁のレーティング1位である柯潔九段と、Google傘下のDeepMindが開発するコンピュータ囲碁ソフトウェア「AlphaGo」の対局が5月23日に行われた。第1局はAlpheGoが半目差で勝利(ITmedia)。

AlphaGoは、現在レーティング7位の李世ドル九段と昨年対局し4勝1敗で勝ち越し、レーティング2位となった。その後AlphaGoは一時柯潔九段を抜きレーティング1位となったが、現在GoRatings.orgによるレーティング対象からは外れている。

  • by Anonymous Coward on 2017年05月24日 13時30分 (#3216025)

    この手のソフトは用意したデータセットによって学習結果が大きく変わる。
    データセットを変えて学習しなおしたら、身体は一緒だけど中身が違う、ヒトで例えれば双子の片割れのようなものになる。おそらくはAplhaGoも学習リセットのようなことはしてるだろう。

    つまり「AlphaGoのレーティング」算出に用いたデータは大勢いるAlphaGo双生児vs棋士の勝負データなのかなと思う。AlphaGoのレーティングを決めるというのは人類のレーティングを決めるのに等しい行為なのかなw

    ここに返信
    • AlphaGOって最初は棋譜を学習してある程度良い手を打てるようになったら
      自己対戦による強化学習してる(前回では500万回ww)から、与えた教材が~
      というよりも前回負けた原因でもあるモンテカルロ木探索のパラメーターを
      修正して再度強化学習したんだろうなーと。

      前回のタレコミでAlphaGOには囲碁のルールが実装されてないって言ったら
      フルボッコになったなー
      自己学習における勝敗判定の先生にはもちろんルールが仕込まれてるけど、
      AlphaGo自身には囲碁のルールなんて実装されてないって、もう一度ここで
      大声で言っておこう

    • by Anonymous Coward

      「俺は修行して生まれ変わったんだ。去年までの俺と一緒だと思わないことだな。」
      というのは、人間のセリフだろ?(小っ恥ずかしくて普通は使えないけど。)

      学習して成長して変化していくのは、べつにAlphaGoの専売特許じゃない。むしろ変化しない方が珍しい。

      >AplhaGoも学習リセットのようなことはしてるだろう。
      そのソースは?

      とりあえず、自分は今までそういう発表は見たことない。

    • by Anonymous Coward

      AlphaGoVSAlphaGoのようなこともやってるところはやってる。

      • by Anonymous Coward

        それこそ兄弟対決だね。優秀な方を採用

  • by Anonymous Coward on 2017年05月24日 15時22分 (#3216086)

    http://imgur.com/a/hLIYw [imgur.com]

    前回はCPU+GPUのサーバを1ラック使ったところ、今回はCPU+TPUで1ノードに削減してきたようだ。大雑把な話で計算能力は1/10とも言われている。

    ここに返信
    • by Anonymous Coward

      計算能力が上がったから削減できたのでは…

typodupeerror

開いた括弧は必ず閉じる -- あるプログラマー

読み込み中...