Post

Conversation

ディープ・ニューラルネットワーク+強化学習(何がうまくいって何がうまくいかなかったか、綿密な記録をとりながら何百回もゲームをこなす) →ブロック崩しについて、2時間でAIはブロック壁のうしろにボールを打てば、ほぼ際限なく跳ね返ってブロックを次々と崩し、得点が加算されることを学習した。