22歳の天才エンジニア「Claude Mythos」を推測でほぼ完コピ、無料で公開する
米Anthropicの非公開AIモデル「Claude Mythos」のアーキテクチャを理論的に推定し、再構築したオープンソースプロジェクト「OpenMythos」が公開された。22歳の開発者Kye Gomez氏が主導し、公開済みの研究論文群を元にPyTorchで構築した。7億7000万パラメータの小規模構成で、13億パラメータのモデルに匹敵する推論性能を示す。 【図版付き記事はこちら】22才の天才開発者がMythosのモデルを推測で構築、無料で公開(図版:ビジネス+IT)
Claude Mythos の構造を推測で模倣し、オープンソースで公開
OpenMythosは、米Anthropicの非公開AIモデル「Claude Mythos」の「Silent Reasoning(暗黙の推論)」アーキテクチャの再現を目的とするプロジェクトである。Claude Mythosは高度なサイバーセキュリティ能力を持つとされ、「Project Glasswing」と呼ばれるAnthropic内部のペネトレーションテスト等で運用されているが、安全上の理由からモデル自体の外部公開は見送られている。Gomez氏はこの非公開モデルの内部構造を、再帰的深さを持つTransformerやループ型言語モデルに関する複数の既存研究から推定し、第一原理に基づいて独自に構築した。 開発の基盤には、「Parcae」と呼ばれるループ型言語モデルのスケール則に関する論文や、推論プロセスを潜在空間内で反復処理する技術文献が用いられている。技術メディアの報道によると、OpenMythosのアーキテクチャは7億7000万パラメータという小規模な構成でありながら、従来の13億パラメータ規模のTransformerモデルに同等の性能を発揮する。 海外の技術コミュニティやRedditでは、この推論特化型モデルが今後のAI開発エコシステムに与える影響が議論されている。巨大な計算インフラを持たない開発者であっても、高度な推論機能を持つAIシステムをローカル環境で稼働させる手段となるためだ。事実、一部の開発者はAMDのプロセッサ「Strix Halo」などを搭載したハードウェア環境を用いて、OpenMythosの動作検証をすでに進めている。 今回のプロジェクト公開はAIのセキュリティ体制に関する新たな課題を浮き彫りにした。Anthropicが危険性を考慮して非公開とした技術の基幹部分が、誰でもアクセスできる公開文献の組み合わせによって、オープンソースの枠組みで実質的に再現された。高度な未公開モデルであっても、既存研究の延長線上でアーキテクチャのリバースエンジニアリングが可能であることが実証された形となる。AIシステムの能力向上と並行して、技術の透明性と安全上のリスク管理をどのように両立させるかという対応が、業界全体に求められている。