LLMの概念空間の構造解明：脳のような機能別「領域」仮説　MITの研究チームが発表

学術＆研究

2024/11/16 [SAT]

LLMの概念空間の構造解明：脳のような機能別「領域」仮説　MITの研究チームが発表

クリップ機能を活用しましょう！

サインインした状態で「いいね」を押すと、マイページの
「いいね履歴」に一覧として保存されていくので、
再度読みたくなった時や、あとでじっくり読みたいときに便利です。

MITの研究者らは2024年10月10日、スパース・オートエンコーダー（SAE）技術を用いて、大規模言語モデル（LLM）の内部に潜む構造を解明する手法を発表した。この研究によると、LLMの内部構造は「概念」を表現する特徴点が「原子」「脳」「銀河」の3つのスケールで高度に組織化されており、その配置は生物学的な脳の機能的な領域と類似しているという。

原子スケール：結晶構造の発見

小規模な「原子」スケールでは、単語間の関係を反映する「結晶」構造が確認された。この構造は、たとえば「man👩:king:queen」のように、ある特徴点の集合が平行四辺形や台形の形状を形成し、意味論的なベクトル間の関係を示す。この研究では、線形判別分析（LDA）を活用して、単語の長さなどの無関係な妨害因子を排除することで、より鮮明な結晶構造が現れることを確認した。

画像の出典：THE GEOMETRY OF CONCEPTS

脳スケール：中規模のモジュール性

中規模の「脳」スケールでは、数学やプログラムコードに関連する特徴が密集して存在する「ローブ（葉）」を形成していることが判明したという。これらのローブは、機能的に類似した特徴が集約され、脳のfMRI画像で観察される機能的な領域のような分布を示す。

この研究では、特徴同士の共起頻度を基にクラスターを作成し、その空間的な密集度が統計的にランダムな配置よりも顕著であることを確認しているとのこと。

画像の出典：THE GEOMETRY OF CONCEPTS

銀河スケール：大規模なクラスタリング構造

「銀河」スケールでは、特徴点の大規模構造が一様な分布ではなく、特に中間層で特徴の集積が顕著に見られることが確認された。これにより、中間層が情報の圧縮や抽象化に関与している可能性が示唆されている。また、層ごとのクラスタリングのエントロピーを計測した結果、初期層や後期層では情報が分散しているのに対し、中間層では情報が密集していることが示されている。

The Geometry of Concepts7.jpg

画像の出典：THE GEOMETRY OF CONCEPTS

研究によると、LLMが高度に組織化された内部構造を持ち、まるで脳の機能的領域のように概念空間を分割している可能性を示すとのこと。

関連記事：AnthropicがAIの「ブラックボックス」の一部解明に成功

クリップ機能を活用しましょう！

Google が推進する次世代音声生成技術の最前線

Google

論文

学術＆研究

2024/11/14 [THU]

新たなRAGシステム「HtmlRAG」HTMLをそのまま活用するRAGシステムの可能性を探る

論文

学術＆研究

2024/11/13 [WED]

生成AIが企業研究者の生産性に与える影響を検証——「上位10%の研究者は生産性が81%向上、下位3分の1の研究者にはほとんど効果なし」の結果に

論文

学術＆研究

2024/11/12 [TUE]

文章作成とイラスト制作におけるCO₂排出量は、AIの方が人間よりも少ない－最大2900倍の差、米研究チームの研究

論文

学術＆研究

2024/11/7 [THU]

アルトマン氏の誤爆？次世代AIモデル「o2」が博士号レベルの高難度ベンチマークで105%のスコアを達成か

OpenAI

学術＆研究

2024/11/4 [MON]

人間の耳では聞き取れないノイズで音楽のAI学習を防御する「HarmonyCloak」テネシー大学などの研究チームが開発

知財

論文

学術＆研究

2024/11/1 [FRI]

東芝、人物の行動認識を高速・高精度に実現する「ハイブリッド行動認識AI」を発表

国内企業事例

学術＆研究

2024/11/1 [FRI]

OpenAIの音声認識AI「Whisper」：医療分野での活用に「幻覚」リスクが浮上

OpenAI

学術＆研究

2024/10/31 [THU]

Google DeepMind、AI生成テキスト識別技術「SynthID Text」を発表：デジタル透かしで文章の生成元を特定可能に

Google

論文

学術＆研究

2024/11/16 [SAT]

Google が推進する次世代音声生成技術の最前線

Google

論文

Google

論文

学術＆研究

2024/11/14 [THU]

新たなRAGシステム「HtmlRAG」HTMLをそのまま活用するRAGシステムの可能性を探る

論文

学術＆研究

2024/11/13 [WED]

生成AIが企業研究者の生産性に与える影響を検証——「上位10%の研究者は生産性が81%向上、下位3分の1の研究者にはほとんど効果なし」の結果に

論文

学術＆研究

2024/11/12 [TUE]

文章作成とイラスト制作におけるCO₂排出量は、AIの方が人間よりも少ない－最大2900倍の差、米研究チームの研究

論文

学術＆研究

2024/11/7 [THU]

アルトマン氏の誤爆？次世代AIモデル「o2」が博士号レベルの高難度ベンチマークで105%のスコアを達成か

OpenAI

学術＆研究

2024/11/4 [MON]

人間の耳では聞き取れないノイズで音楽のAI学習を防御する「HarmonyCloak」テネシー大学などの研究チームが開発

知財

論文

知財

論文

学術＆研究

2024/11/1 [FRI]

東芝、人物の行動認識を高速・高精度に実現する「ハイブリッド行動認識AI」を発表

国内企業事例

学術＆研究

2024/11/1 [FRI]

OpenAIの音声認識AI「Whisper」：医療分野での活用に「幻覚」リスクが浮上

OpenAI

学術＆研究

2024/10/31 [THU]

Google DeepMind、AI生成テキスト識別技術「SynthID Text」を発表：デジタル透かしで文章の生成元を特定可能に

Google

論文

Google

論文

アクセスランキング

LLMの概念空間の構造解明：脳のような機能別「領域」仮説　MITの研究チームが発表

無限の物語を生み出すゲームシステム「UNBOUNDED」生成AIが約1秒で画像を生成しプレイヤー独自のストーリーをリアルタイムで展開

Meta、オープンソースLLM「Llama」を米国政府機関や防衛関連企業に提供　中国も「Llama」ベースのAIモデルを軍事利用に向けて開発

LoRA(ローラ)とは｜今年注目の画像生成AI (Stable Diffusion) のファインチューニングを試してみた

FERC、Amazonとタレン・エナジーによる原子力発電からデータセンターへの供給拡大計画を拒否

AIが未発見のバグを検出 ─ GoogleがSQLiteにおける脆弱性をAI技術で特定　従来の手法では検出困難

新たなRAGシステム「HtmlRAG」HTMLをそのまま活用するRAGシステムの可能性を探る

楽天、都内で自動配送ロボット「楽天無人配送」を本格始動－晴海・月島エリアでサービス開始

DJIが新製品「DJI Goggles N3」を発表　長時間・低遅延でリアルな一人称視点の飛行体験が可能に

世界初の汎用型光量子計算プラットフォームを開発－理研、NTT、Fixstarsが新方式の量子コンピュータを実現

人気のタグ

各種SNSでも最新情報をお届けしております

Cookie Settings

LLMの概念空間の構造解明：脳のような機能別「領域」仮説 MITの研究チームが発表

クリップ機能を活用しましょう！

原子スケール：結晶構造の発見

脳スケール：中規模のモジュール性

銀河スケール：大規模なクラスタリング構造

クリップ機能を活用しましょう！

Google が推進する次世代音声生成技術の最前線

新たなRAGシステム「HtmlRAG」HTMLをそのまま活用するRAGシステムの可能性を探る

生成AIが企業研究者の生産性に与える影響を検証——「上位10%の研究者は生産性が81%向上、下位3分の1の研究者にはほとんど効果なし」の結果に

文章作成とイラスト制作におけるCO₂排出量は、AIの方が人間よりも少ない－最大2900倍の差、米研究チームの研究

アルトマン氏の誤爆？次世代AIモデル「o2」が博士号レベルの高難度ベンチマークで105%のスコアを達成か

人間の耳では聞き取れないノイズで音楽のAI学習を防御する「HarmonyCloak」テネシー大学などの研究チームが開発

東芝、人物の行動認識を高速・高精度に実現する「ハイブリッド行動認識AI」を発表

OpenAIの音声認識AI「Whisper」：医療分野での活用に「幻覚」リスクが浮上

Google DeepMind、AI生成テキスト識別技術「SynthID Text」を発表：デジタル透かしで文章の生成元を特定可能に

Google が推進する次世代音声生成技術の最前線

新たなRAGシステム「HtmlRAG」HTMLをそのまま活用するRAGシステムの可能性を探る

生成AIが企業研究者の生産性に与える影響を検証——「上位10%の研究者は生産性が81%向上、下位3分の1の研究者にはほとんど効果なし」の結果に

文章作成とイラスト制作におけるCO₂排出量は、AIの方が人間よりも少ない－最大2900倍の差、米研究チームの研究

アルトマン氏の誤爆？次世代AIモデル「o2」が博士号レベルの高難度ベンチマークで105%のスコアを達成か

人間の耳では聞き取れないノイズで音楽のAI学習を防御する「HarmonyCloak」テネシー大学などの研究チームが開発

東芝、人物の行動認識を高速・高精度に実現する「ハイブリッド行動認識AI」を発表

OpenAIの音声認識AI「Whisper」：医療分野での活用に「幻覚」リスクが浮上

Google DeepMind、AI生成テキスト識別技術「SynthID Text」を発表：デジタル透かしで文章の生成元を特定可能に

LLMの概念空間の構造解明：脳のような機能別「領域」仮説　MITの研究チームが発表