会話

1つだけ。AlphaGoZeroでは「教師なし学習の方が最終的に強くなることが証明された。」わけではなく、教師なしでもできる、というのが正確です。また棋譜(教師データ)よりはシチョウなどのドメイン知識がより強さに関わっているかと思います。そのあたりは会見の中で山口さんも言及しています。
引用ツイート
梅木大輔
@umeki_daisuke
わかりやすい。 本来深層学習には、大量のデータが必要だけど、alphagozeroが証明したように囲碁AIについては自ら大量の対戦をさせて学習させることができるし、教師なし学習の方が最終的に強くなることが証明された。 本来の人工知能競争ではGAFAのある米国や、巨大人口があり(続く) twitter.com/ohashihirofumi…
1
22
natureの論文では、教師なしのzeroは最初こそ強くなるのは遅いものの最終的にはイロレーティングが5000を超えたのに対して、教師ありのmasterは最初こそ強くなるのは早いものの4000台に留まっていたように記憶していましたが。 その辺はどう解釈したものでしょうか?
AlphaGoZeroは2種類あって20ブロックが約4300、40ブロックが約5100です。AlphaGoMasterは特に言及されてませんが、20ブロック規模なのは間違いないと考えています。AlphaGoMasterは4800でドメイン知識や棋譜学習をしているはずです。つまり同じ条件で比べればそちらのほうが500点ほど強いです。
1
2
なるほど。ありがとうございます。 同じ前提かと思っていましたが、違う環境下なんですね。 そうすると確かに教師なし学習の方が良いとは言い切れないですね。
1
1
返信を表示