Post

Conversation

Geminiの事後学習多言語リーダーを辞め、長考モデル・強化学習チームへ異動しました。このチームでは、数学オリンピックIMOで金メダルを獲得したチームを率いたQuocLe氏や、AlphaGoのDavidSilver氏の元エンジニアなどと共に、人工汎用超越知能(AGSI)の開発を目指します。上司は長考モデルの共同リーダーであるTimLillicrap氏です。完全版IMOモデルは先週から特定の数学者に向けて公開され、現在実験が行われています。同時に、簡略版の「Gemini-2.5-Deep-Think」がUltra登録者向けに一般公開されました。この簡略版は、公開されているモデルの中でも数学やHLEでトップクラスの性能を誇りますが、かなりの計算量を必要とします。特に外部のツールなしでここまでの思考を言語モデルだけで出来たのは素晴らしい成果で(強化学習時はもちろん使っているが)、2022年に私が書いた論文「大規模言語モデルは自己改善出来る」で予想していた未来が起き始めています。私のチームの今後の採用は主にアメリカのGoogle本社を拠点に行われる予定です。チームの一部は日本にもいるため、多言語思考の分野は引き続き強化していきます。これからが楽しみです。
Image
Image
Image
Image