当サイトは、Cookieを使用しコンテンツの改善に利用しています。アクセスを継続することでCookie情報の利用に同意するものとします。同意します

    Top > 学術&研究 > LLMの概念空間の構造解明:脳のような機能別「領域」仮説 MITの研究チームが発表
学術&研究
2024/11/16 [SAT]

LLMの概念空間の構造解明:脳のような機能別「領域」仮説 MITの研究チームが発表

LLMの概念空間の構造解明:脳のような機能別「領域」仮説 MITの研究チームが発表のサムネイル画像

画像の出典:THE GEOMETRY OF CONCEPTS

MITの研究者らは2024年10月10日、スパース・オートエンコーダー(SAE)技術を用いて、大規模言語モデル(LLM)の内部に潜む構造を解明する手法を発表した。この研究によると、LLMの内部構造は「概念」を表現する特徴点が「原子」「脳」「銀河」の3つのスケールで高度に組織化されており、その配置は生物学的な脳の機能的な領域と類似しているという。

原子スケール:結晶構造の発見

小規模な「原子」スケールでは、単語間の関係を反映する「結晶」構造が確認された。この構造は、たとえば「man👩:king:queen」のように、ある特徴点の集合が平行四辺形や台形の形状を形成し、意味論的なベクトル間の関係を示す。この研究では、線形判別分析(LDA)を活用して、単語の長さなどの無関係な妨害因子を排除することで、より鮮明な結晶構造が現れることを確認した。

GbD1oOLbQAAmEv-.jpg

画像の出典:THE GEOMETRY OF CONCEPTS

脳スケール:中規模のモジュール性

中規模の「脳」スケールでは、数学やプログラムコードに関連する特徴が密集して存在する「ローブ(葉)」を形成していることが判明したという。これらのローブは、機能的に類似した特徴が集約され、脳のfMRI画像で観察される機能的な領域のような分布を示す。

この研究では、特徴同士の共起頻度を基にクラスターを作成し、その空間的な密集度が統計的にランダムな配置よりも顕著であることを確認しているとのこと。

GbD1uA_bQAI0dgw.jpg

画像の出典:THE GEOMETRY OF CONCEPTS

銀河スケール:大規模なクラスタリング構造

「銀河」スケールでは、特徴点の大規模構造が一様な分布ではなく、特に中間層で特徴の集積が顕著に見られることが確認された。これにより、中間層が情報の圧縮や抽象化に関与している可能性が示唆されている。また、層ごとのクラスタリングのエントロピーを計測した結果、初期層や後期層では情報が分散しているのに対し、中間層では情報が密集していることが示されている。

The Geometry of Concepts7.jpg

画像の出典:THE GEOMETRY OF CONCEPTS

研究によると、LLMが高度に組織化された内部構造を持ち、まるで脳の機能的領域のように概念空間を分割している可能性を示すとのこと。

関連するタグ
Ledge.ai 編集部

Ledge.ai編集部です。最新のAI関連技術、テクノロジー、AIのビジネス活用事例などの情報を毎日発信しています。

関連記事
学術&研究
2024/11/16 [SAT]
Google が推進する次世代音声生成技術の最前線のサムネイル画像

Google が推進する次世代音声生成技術の最前線

Google
論文
学術&研究
2024/11/14 [THU]
新たなRAGシステム「HtmlRAG」HTMLをそのまま活用するRAGシステムの可能性を探るのサムネイル画像

新たなRAGシステム「HtmlRAG」HTMLをそのまま活用するRAGシステムの可能性を探る

論文
学術&研究
2024/11/13 [WED]
生成AIが企業研究者の生産性に与える影響を検証——「上位10%の研究者は生産性が81%向上、下位3分の1の研究者にはほとんど効果なし」の結果にのサムネイル画像

生成AIが企業研究者の生産性に与える影響を検証——「上位10%の研究者は生産性が81%向上、下位3分の1の研究者にはほとんど効果なし」の結果に

論文
学術&研究
2024/11/12 [TUE]
文章作成とイラスト制作におけるCO₂排出量は、AIの方が人間よりも少ない-最大2900倍の差、米研究チームの研究のサムネイル画像

文章作成とイラスト制作におけるCO₂排出量は、AIの方が人間よりも少ない-最大2900倍の差、米研究チームの研究

論文
学術&研究
2024/11/7 [THU]
アルトマン氏の誤爆?次世代AIモデル「o2」が博士号レベルの高難度ベンチマークで105%のスコアを達成かのサムネイル画像

アルトマン氏の誤爆?次世代AIモデル「o2」が博士号レベルの高難度ベンチマークで105%のスコアを達成か

OpenAI
学術&研究
2024/11/4 [MON]
人間の耳では聞き取れないノイズで音楽のAI学習を防御する「HarmonyCloak」テネシー大学などの研究チームが開発のサムネイル画像

人間の耳では聞き取れないノイズで音楽のAI学習を防御する「HarmonyCloak」テネシー大学などの研究チームが開発

知財
論文
学術&研究
2024/11/1 [FRI]
東芝、人物の行動認識を高速・高精度に実現する「ハイブリッド行動認識AI」を発表のサムネイル画像

東芝、人物の行動認識を高速・高精度に実現する「ハイブリッド行動認識AI」を発表

国内企業事例
学術&研究
2024/11/1 [FRI]
OpenAIの音声認識AI「Whisper」:医療分野での活用に「幻覚」リスクが浮上のサムネイル画像

OpenAIの音声認識AI「Whisper」:医療分野での活用に「幻覚」リスクが浮上

OpenAI
学術&研究
2024/10/31 [THU]
Google DeepMind、AI生成テキスト識別技術「SynthID Text」を発表:デジタル透かしで文章の生成元を特定可能にのサムネイル画像

Google DeepMind、AI生成テキスト識別技術「SynthID Text」を発表:デジタル透かしで文章の生成元を特定可能に

Google
論文
アクセスランキング
LLMの概念空間の構造解明:脳のような機能別「領域」仮説 MITの研究チームが発表
無限の物語を生み出すゲームシステム「UNBOUNDED」 生成AIが約1秒で画像を生成しプレイヤー独自のストーリーをリアルタイムで展開
Meta、オープンソースLLM「Llama」を米国政府機関や防衛関連企業に提供 中国も「Llama」ベースのAIモデルを軍事利用に向けて開発
4
LoRA(ローラ)とは|今年注目の画像生成AI (Stable Diffusion) のファインチューニングを試してみた
5
FERC、Amazonとタレン・エナジーによる原子力発電からデータセンターへの供給拡大計画を拒否
年末年始特集24to25 rectangle_top
FOLLOW US
各種SNSでも最新情報をお届けしております