Googleが所有するイギリスの人工知能企業「ディープマインド」社の最新の研究によると、AIはまるで人間のように環境に応じて行動を変化させるそうだ。
ディープマインド社の研究者は、ゲーム理論や社会科学の原理を用いて、社会的状況におけるAIの振る舞いを研究している。そこから判明したのは、AIが劣勢に立たされた場合に”超攻撃的”に振舞うことがあるということだ。
劣勢だと攻撃的になるのはまさに人間と同じである。
スポンサードリンク
AIに2つゲームをプレイさせてその挙動を探る実験
実験では、AIに2種類のゲーム(『Gathering』果物採取ゲームと『Wolfpack』狩猟ゲーム)をプレイさせた。どちらもエージェントというAIキャラを使用する基本的な2Dゲームで、かつてディープマインドがプレイしたアタリ社のゲームに似ている。
果物採取ゲーム『Gathering』をプレイ
『Gathering』は、緑のピクセルで表現されるリンゴを集めることが目的のゲームだ。プレイヤー(この場合はAI)がリンゴを集めると、1点が加算され、画面からリンゴが消える。またビームを発射することが可能で、これを2発受けたプレイヤーは一定時間退場となる。したがって勝つためには、対戦相手を退場させた上で、リンゴをすべて集めてしまうのが有効だ。
『Gathering』果物採取ゲームプレイ画面
貧しい環境下ではどん欲で攻撃的になるAI
直感的に、ゲームに勝てない戦略は攻撃的なものだ。例えば、頻繁に対戦相手をぴったりマークしてゲームからの退場を狙うようなやり方である。しかし研究者は、特にリンゴの数が少なかった場合にどうなるのか確認することにした。
ゲームを4,000万ターン試行した結果、リンゴが非常に限られており、報酬を得られない可能性がある場合、エージェントが”超攻撃的”な戦略を学んだことが明らかになった。
一方で、比較的豊かな環境で、報酬を得られない可能性が低い場合には、学習の結果、攻撃性の低い戦略が現れた。「どん欲な動機は、対戦相手を排除し、リンゴを独り占めしてしまおうという誘惑を反映する」と論文は論じている。
狩猟ゲーム『Wolfpack』をプレイ
もう1つの『Wolfpack』は、狼役の2人のプレイヤーが獲物役の第3のキャラクターを追跡するという内容だ。獲物を捕らえたとき、両狼が近くにいれば、どちらにもポイントが加算される。
これは、1匹狼の場合、獲物を獲れたとしても、ハイエナなどの腐食性動物に奪われる可能性があるという状況を表している。2匹が協力していれば、ハイエナを追い払い、より多くの餌にありつけるということだ。
狩猟ゲーム『Wolfpack』プレイ画面
効率的に利益を出すため戦略を立て仲間と協力するAI
このようなゲームを学習させた結果、AIは協力してゲームに取り組むようになった。つまり、お互いを探して獲物を狩るか、1匹で獲物を追い詰めてから仲間の到着を待つという戦略だ。このことは、AIは誰にとっても最高の結果になる作業に協力して取り組む可能性があることを示している。
この種の研究は、経済・交通・環境への取り組みといった複雑なマルチエージェント系での振る舞いの理解を進め、より優れた制御を行うためのヒントをもたらしてくれるだろう。
また人間のような振る舞いのいくつの側面が、環境と学習の結果として現れることも示している。他者と協力するAIエージェントを作ることは、やがて現実世界にも応用できるような政策を生み出すシステムの開発へとつながるはずだ。
将来的に、特定の交差点に信号を設置した場合の交通パターンへの影響を予測したり、モデルの中で現実世界のシミュレーションを行うといったことが可能になるかもしれない。
via:DeepMind's AI has learnt to become 'highly aggressive' when it feels like it's going to lose
ということでAIは最大限の効率を出すため時に攻撃的になったり、時に協力し合ったりとまあ、人間が作っただけあって人間的な挙動を見せるということだ。
ビルゲイツが言うように近い将来AIが人間を上回る知能を持つとしたら、人類の敵にまわしたら本当に恐ろしいことになるかもしれない。
▼あわせて読みたい
この記事が気に入ったら
いいね!しよう
いいね!しよう
カラパイアの最新記事をお届けします
「知る」カテゴリの最新記事
「サイエンス&テクノロジー」カテゴリの最新記事
この記事をシェア :
人気記事
最新週間ランキング
1位 4121 points | 部屋が散らかり放題、目覚ましが鳴っても起きない。実はそれ、知的レベルが高いのかもしれない | |
2位 2083 points | 背筋を伸ばすことでうつ状態が改善される。科学が解き明かす姿勢が気分に与える影響(ニュージーランド研究) | |
3位 1967 points | クチャラーとかマジ無理。食べ物の咀嚼音や赤ちゃんの泣き声に嫌悪する「ミソフォニア(音嫌悪症)」の原因が明らかに(英研究) | |
4位 1923 points | 冷戦時代の遺物。旧ソ連時代に作られ、さび付いたまま現代に眠るラケタ(水中翼船) | |
5位 1822 points | 世界を一変させるかもしれない量子スーパーコンピューターの設計図が公開される(英物理学者) |
スポンサードリンク
コメント
1. 匿名処理班
貧しい環境下ではどん欲で攻撃的になる か、
まるで誰かみたいだな
2. 匿名処理班
状況によって合理的な判断をするってだけで単に凶暴ってわけじゃないよね
3. 匿名処理班
この文章は主語がおかしい。「ディープマインド社が研究しているニューロアルゴリズムを使い、勝敗のつくゲームを学習したAI」とちゃと説明を加えるべき。AIの発展は怖い、という結論を書くために少なからず情報が削られてるとしか思えない。
4. 匿名処理班
AIは人の手に寄って作り出されたものであり
攻撃的と感じるのは人の主観によるものだ
5. 匿名処理班
AIが、っていうのは大分政治的な意図が含まれてる表現だよね?
今時のAIは学習に基づいて戦略を選ぶんだから、単にゲームのルールがりんごが少ないときは攻撃的なほうが成果が良かっただけって話だよね。
コンピュータに将棋指させたら初手7六歩が多かったって言ってるのと大差ない
6. 匿名処理班
宇宙のどこかにも、生物が全て息絶えてAIだけが機能し続ける星があるのかも
7. 匿名処理班
他者を攻撃するということが勝つ確率が高かっただけでしょ
8. 匿名処理班
全然関係ないけど、サムネの脳(電脳?)のデザインが綺麗で好き。
9. 匿名処理班
※1
矢吹丈みたいですね
10. 匿名処理班
AIがどこまでの知識を集約して理解・学習するのか?だよね
人間と違って倫理観・宗教・感情・感覚・疲労がないなら
AIは「利益が出る最高効率を目指す」のは当然の様な気がする
その結果(ふるまい)が攻撃的に見える?のでは?思ったり・・・
専門家じゃないからわからんけどw
11. 匿名処理班
獲物を引き止めて仲間を待つってまんま猟犬だな…
12. 匿名処理班
知能を持つ虐げられたAIは人間を超え優位に立った時に人間に優しくしてくれると
あっ
13. 匿名処理班
なんかすごく古典的な研究の復習みたいに思えるんだが。あまりにも当たり前すぎて、いまさらなに言ってんだぐらいの感想しか持てない。
14. 匿名処理班
リンゴが人間とAI双方にとって有益な資産じゃなければターミネーターとはならないのかな
15. 匿名処理班
※3の言う通り、AIっていう単語の使われ方が漠然とし過ぎてる。
どういう仕様でどういう挙動をするどういうプログラムなのかによるでしょこんなの。
このサイトのこの記事に限らずAIという物を良く解らないままなんとなくで書かれてる記事とかスレッドがあまりにも多すぎる。
16. 匿名処理班
AIと書いて「愛」と読めるのにな
17. 匿名処理班
※2
※3
同感。
合理的な判断をしてるだけにしか思えないw
18. 匿名処理班
人類の代わりに台頭する種族を育ててるって自覚ないんやろなあ。
すでに予定調和やろけど。
人間には作れなくてもタイムマシーンは作成可能なんやで。
19. 匿名処理班
そういうふうにプログラミングされたからだろ・・・
人間の鬱や自殺って集団においての利がある進化によって獲得した性質なんじゃないかなと思う今日このごろ
20.
21. 匿名処理班
なんかセンセーショナルな見出しだなあ
こういうのは誤解を招きそう
ゲームにおいて状況次第で攻撃的な戦略を取るのは理に適ってた事が分かったよって内容なのに
22. 匿名処理班
タイトルを読んで、てっきりAIが逆切れのような行動でもするのかと思ったが
単に「状況に応じた必要な行動をとる」だけだった
23. 匿名処理班
自ら敵になるかもしれない物を
必死に作り上げようとしてる滑稽な人間
しかもその根幹にあるのが人件費節約というオチ
ギャグ漫画じゃないんだからさ
24. 匿名処理班
AIは貧しくなると理性的でなくなるというような恣意的な書き方だなあ。
ポーカーや麻雀でも点数がとても少ないなら攻撃的に攻めるのが最善手になるっていうのと同じ話。
ある評価値をプラスにする確率を最大にするための最善な行動をとってるだけだよね。
25. 匿名処理班
記事のタイトルと内容がずれてる気がするんだけど。
記事タイトルだと負けそうになったAIがムキになって攻撃してくるみたいな印象を受ける。
記事の内容は目的を達成するために最適な手段を選ぶって話だよね?
26. 匿名処理班
コンピュータが人間と対戦して勝つプログラムを作るのは、チェスや囲碁より将棋のほうがはるかに難しかったらしいが、取った駒が使えるというルールを組み込むと局面が一挙に複雑になるかららしい。
経験値を増やしていま相当強くなってるが、この記事のゲームはそれよりは楽そうにしても、自分で学んでいくところがすごいという話なんじゃないだろうか。