AI(人工知能)は学習するデータを食べ尽くしても、学習スキームだけで進化していく――。小説家、経営者、AI研究者である山田尚史さんと、同じく小説家でありAIエンジニア、起業家としても活躍し、2024年の東京都知事選挙で注目を集めた安野貴博さんは、かつてともに同じ東京大学・松尾豊研究室で学んだ仲。それぞれの著書『きみに冷笑は似合わない。 SNSの荒波を乗り越え、AI時代を生きるコツ』(日本経済新聞出版)と『 1%の革命 ビジネス・暮らし・民主主義をアップデートする未来戦略 』(文藝春秋)の発売を記念して対談しました。YouTubeチャンネル「【生成AI】安野貴博の自由研究チャンネル【SF作家】」の番組を再構成して3回にわたりお届けする第1回。
斜に構えるのをやめてみよう
安野貴博さん(以下、安野) 今回は山田尚史さんとの対談ということですが、僕たちかなり経歴がかぶっていますよね。
山田尚史さん(以下、山田) 偶然なんですけどね。職業が起業家、経営者、小説家みたいなところで、だいぶ重なっていますね。
安野 学校も2人とも中学・高校が開成で、山田さんが僕の1個上。大学は東京大学工学部のシステム創成学科Cコース、松尾豊研究室にいた。
山田 社会人になってからは一瞬離れたけれど、僕が先輩とAI開発のPKSHA Technologyを立ち上げて…。
安野 僕はその子会社としてBEDORE(現・PKSHA Communication)を起業しました。同じフロアで切磋琢磨(せっさたくま)というか、いろいろと面白い日々を過ごしていました。
山田 毎日本当に面白くて、それはそれでまた語りたいくらいです。作家デビューは安野さんが1年先でしたね。
安野 そうです。2022年に『 サーキット・スイッチャー 』(ハヤカワ文庫JA)でデビューしました。で、ある日、『このミステリーがすごい!』大賞を見ていると、山田さんが大賞を受賞されていた(2023年10月発表。『 ファラオの密室 』宝島社文庫で受賞)。今回の山田さんの新刊『きみに冷笑は似合わない。』は、フィクションではなくノンフィクションですね。
山田 はい。自分自身が起業家あるいは小説家志望者としてずっと夢を追ってきた経験から、斜に構えるのはやめて夢を追いかけませんかと、読者の皆さんに呼びかけるような本になったかと思います。最近はSNS(交流サイト)の中でいろんな誹謗(ひぼう)中傷というか、少し斜に構えて面白がるような風潮が増えてきたように感じるので、どうしてそうなっているんだろう、みたいなところのメッセージも込めて執筆しました。
安野 私も刊行前に拝読して帯に推薦文を書かせていただきましたが、この本には「AI時代の生存戦略」が書かれていて、めちゃめちゃ面白かったです。タイトルだけ見るともう少し抽象的なことが書かれているのかと思いきや、中身は山田さんのお薦めの本なども含め、具体的なアドバイスが数多く紹介されていています。
本文中に、自動化された世界において人間の仕事は「ボトルネックを探すこと」と指摘されていて、これについて学ぶためのいい方法の一つは「Factorio(ファクトリオ)」(*1)をプレーすることだとありました。この辺が特に面白いと感じました。
山田 ファクトリオはソフトウエア・エンジニアの日頃の仕事にも通じるところがあるので、やっておいて間違いはないです。本の内容としては他にも、これから起こることに対して割と有用なことも入っているのではないかと思っています。
AIは進化の加速度が大きすぎる
安野 そもそもですが、なぜこの本を書こうと思ったのですか。
山田 安野さんも起業に関する本(『 松岡まどか、起業します AIスタートアップ戦記 』早川書房)を書かれていますが、初めはAIお仕事本みたいな小説があると面白いかなと考えていました。ただ、メッセージを伝えきるにはフィクションにせず普通に自分の言葉を書いた方がいいのではと思うようになり、ビジネス書としてまとめた、というのが経緯ですね。あとは時代的な背景もあります。やはり、あまりにもAIが進みすぎているのではないかと感じています。
安野 山田さんはAIの進化についてどう見ていますか。
山田 進化の「加速度」が大きすぎると感じます。本にも書きましたが、5年前に今のことって絶対に予測できなかったと思うんですよね。
安野 5年前の2020年だと、ChatGPTの2は出ていたけれど、公開はしないみたいな状態でした。それが今や4.5まで来ていて、ニュースでも当たり前にDeepSeek(中国のスタートアップが開発したAI)や蒸留(*2)の話が出てくるほどです。
山田 私が起業したのは2012年。ディープラーニング(深層学習)が出たばかりの頃で、ようやく検索ボリュームに出てきたのも2015、16年とか。当時はAIの話題も「なんか最近すごいらしいね」程度でした。
安野 囲碁AIのAlphaGo(アルファ碁)が韓国のプロ棋士イ・セドルさんに勝利したのが2016年でした。そのニュースによって、AIが大きく注目されるようになったと思います。
山田 当時は深層強化学習が盛り上がっていましたね。そのときから考えると、今のAIのアウトプットは「ほぼ人間」みたいな感覚ですね。
安野 僕もAIの進化を追ってる方だとは思うのですが、追いつかないんですよね。新しいニュースを見たり、新しい論文とかを読んでいたりすると1日が終わってしまうくらいのスピードになっていて、もう完璧に追うのは無理だと感じてしまいます。
山田 AIの有用性がある程度分かると、時間もお金も人手もそこに集中してきて発展スピードがとんでもないものになる。皆が世界のどこかで、今この瞬間も研究している。しかもAIによってそれが加速している状態ですね。
生成AIはまだまだ賢くなる
安野 このスピード感は今後、どうなっていくと思いますか。
山田 「さらに加速する」「今ぐらい」「どこかでしぼむ」、その3択じゃないですか。それぞれ検討すると、「どこかでしぼむ」と考える根拠はChatGPT4.5の性能が期待よりはいまいちであることが一つと、あとはデータ量。人間が作ってきたデータを食い尽くしそうという制約からです。しかし、ハードウエアの進化はまだまだ起こると思っていて、それによって学習サイクルも早くなっていく。ですので、やはり一定まで加速し続けると思います。
安野 僕もそう思いますね。ChatGPT4.5の「学習データ食べ終わった話」はあると思いますが、とはいえ強化学習によってAIを賢くさせるのは、正直まだ始まったばかりだと感じています。o1(OpenAIの論理的思考力を高めたAI)ですら2024年9月に出てきたばかりなので、できることはたくさんあると思いますね。最近だとClaude 3.7 Sonnet(アンソロピックの最新AIモデル)がポケモンをプレーしていますが、ああいうゲームのようなものを報酬に食べて推論モデルが強化されていくので、まだまだ伸びしろはあるはずです。
山田 そうですよね。アルファ碁の場合、碁のルールのおかげで、勝ち負けにより性能が良くなった、悪くなったという指標がはっきりしていた。一方、ジェネラルな状況でAI同士が会話をしていても、会話が良くなった、悪くなったという指標を作るのはすごく難しい。なので、ポケモンのようなルールを外部から与えて進化させていくというのは、この先どんどん起こりそうですね。
安野 DeepSeekの最新モデルR1も2つくらいしか報酬を与えていません。1つは言語完成報酬で、いろいろな言語がないまぜにならないようにするというのにまず報酬を与える。もう一つが、算数の問題を解かせて正しいか間違っているかをルールベースで検証して報酬を与える。それだけでR1が作れました。簡単な問題から高度な問題に徐々にシフトさせるとか、報酬設計はもう少し高度にできるはずなので、どんどん賢くなると思います。
山田 データ量ではなくて、学習のスキームだけで精度が上がっていくという話になると、指数関数かは分からないけれど線形には上がってきそうですね。
安野 アルファ碁がイ・セドルさんに勝ったときはおそらく、まだ人間の棋譜から学んでいたと思いますが、その後出てきたAlphaGo Zero(アルファ碁ゼロ)は機械同士で報酬を作り出すことができた。今の生成AIの状況も、Goの時代からZeroの時代に変化してきたのとちょうど同じような過渡期にあるのかなと思います。
山田 確かにそうかもしれませんね。どんなルールでAIを発展させるのか、それは目的ベースで変わっていくとは思うんですけど、それによってユースケースもどんどん増えてくると思いますね。
(第2回に続く)
文/橋口いずみ 写真/洞澤佐智子
山田尚史著/日本経済新聞出版/1650円(税込み)