ReAct: Synergizing Reasoning and Acting in Language Models (言語モデルにおける推論と行動の相乗効果)

2023年2月7日 08:39

「Google AI Blog」の記事「ReAct: Synergizing Reasoning and Acting in Language Models」が面白かったので、簡単にまとめました。

1. はじめに

近年、思考の連鎖 (CoT: Chain of Thought) を促した言語モデルは、さまざまな算術、常識推論タスクに優れ、創発的な能力を発揮します。ただし、独自の内部表現を使用するため、リアクティブに探索・推論したり、知識を更新したりする能力が制限されます。

一方、最近の研究では、事前学習済み言語モデルで「テキストコンテキスト」を「テキスト行動」にマッピングすることで、さまざまなインタラクティブ環境 (例: テキストゲーム、Webナビゲーション、ロボティクス) で行動を決定しています。ただし、それらは多段階の目標について抽象的に推論したり、作業記憶を維持したりしません。

「ReAct: Synergizing Reasoning and Acting in Language Models」では、「推論」(行動理由の推論) と「行動」(理由に従って行動) を組み合わせて、言語モデルでさまざまな言語推論と意思決定タスクを解くための手法を提案します。

2. Reason + Act = ReAct

「ReAct」では、言語モデルは「推論」(行動理由の推論) と「行動」(理由に従って行動) の両方を交互に実行します。「行動」は外部環境 (Env) から新しい情報を「観察」として収集します。「推論」は外部環境に影響を与えませんが、代わりに、コンテキストを推論し、将来の推論と行動に有用な情報で更新し、モデルの内部状態に影響を与えます。

3. ReActプロンプト

「推論」(行動理由の推論) と「行動」(理由に従って行動) の相乗効果により、モデルは動的な推論を実行して、行動するための高レベルの計画を作成、維持、調整できます。また、外部環境 (Wikipediaなど) と相互作用して追加情報を推論に組み込むこともできます。

以下に、質問に対する「標準プロンプト」(Zero-Shot)、「推論のみ」(Reason only)、「行動のみ」(Act only)、「ReAct」(Reason + Act)を比較する例を示します。

◎ 質問

Question: 「物理学についての7つの簡潔なレッスン」は、何年からフランスで活動しているイタリアの物理学者によって書かれたものでしょうか？

◎ 標準プロンプト (Zero-Shot)

Answer: 1986 (不正解)

◎ 推論のみ (Reason only)

Thought: 一歩一歩考えよう。「物理学についての7つの簡潔なレッスン」はカルロ・ロヴェッリによって書かれました。カルロ・ロヴェッリは1990年からフランスで仕事をしています。
Answer: 1990 (不正解)

◎ 行動のみ (Act only)

Act 1: Search [物理学についての7つの簡潔なレッスン]
Obs 1: 「物理学についての7つの簡潔なレッスン」は、イタリアの物理学者カルロ・ロヴェッリによる短編集である。原著はイタリア語で出版され…
Act 2: Lookup [カルロ・ロヴェッリ]
Obs 2: (Result 1/1) 「物理学についての7つの簡潔なレッスン」は、イタリアの物理学者カルロ・ロヴェッリによる短編集です。
Act 3: Finish [1983] (不正解)

◎ ReAct (Reason + Act)

Thought 1: 「物理学についての7つの簡潔なレッスン」を検索し、その著者を見つけ、その著者がその後いつフランスで仕事をしたかを調べる必要がある。
Act 1: Search [物理学についての7つの簡潔なレッスン]
Obs 1: 「物理学についての7つの簡潔なレッスン」は、イタリアの物理学者カルロ・ロヴェッリによる短編集である。原著はイタリア語で...
Thought 2: 「物理学についての7つの簡潔なレッスン」の著者はカルロ・ロヴェッリである。次はカルロ・ロヴェッリを検索して、彼がその後いつフランスで仕事をしたかを探す必要がある。
Act 2 : Search [カルロ・ロヴェッリ]
Obs 2: カルロ・ロヴェッリは、イタリアの理論物理学者、作家で、イタリア、アメリカ、そして2000年以降はフランスで活動している。...
Thought 3: カルロ・ロヴェッリは2000年からフランスで仕事をしている。だから、答えは2000年だ。
Act 3: Finish [2000] (正解)

4. 結果

「HotPotQA」(質問応答)、「Fever」(事実検証)、「ALFWorld」(テキストベースゲーム)、「WebShop」(Webナビゲーション ) の 4つのベンチマークで評価しました。

「HotPotQA」「Fever」では、モデルがWikipedia APIにアクセスできるため、ReAct は通常のアクション生成モデルよりも優れていますが、「CoT」と競合しています。最良の結果をもたらすアプローチは、内部知識と外部情報の両方を使用する「ReAct」と「CoT」の組み合わせです。

「ALFWorld」「WebShop」では、OneShotとTwo-Shotの両方を備えた「ReAct」は、既存のものよりも成功率が34%、10%と向上し、最大105のタスクインスタンスで学習された模倣学習よりも優れています。

5. おわりに

「ReAct」は、言語モデルで「推論」(行動理由の推論) と「行動」(理由に従って行動) を相乗作用させる、シンプルで効果的な手法です。
実験を通じて、「ReAct」がさまざまな言語推論と意思決定タスクにおいて優れたパフォーマンスをもたらすことがわかりました。

いいなと思ったら応援しよう！

自然言語処理入門

1,496本

生成AI

638本

コメントするには、ログインまたは会員登録をお願いします。

ReAct: Synergizing Reasoning and Acting in Language Models (言語モデルにおける推論と行動の相乗効果)

1. はじめに

2. Reason + Act = ReAct

3. ReActプロンプト

4. 結果

5. おわりに

関連

いいなと思ったら応援しよう！

ピックアップされています

自然言語処理入門

生成AI

コメント

【プロンプト設計 #7】ReActで、AIに「考えて行動する」力を与える

LLMがエージェント的推論を獲得

ReActプロンプト完全攻略ガイド～AIを「自律思考型エージェント」に変える思考の型～

AIは裏側で「独り言」を言っている。エージェントが自律的に動く仕組み「ReAct」を解剖する（AIエージェント入門 Vol.2）

AIが本当に賢くなるには、「考える」だけでなく「行動しながら学ぶ存在＝エージェント」になる必要がある https://arxiv.org/pdf/2601.1…

【論文瞬読】ロボットの「考える速度」を9倍高速化：Fast-ThinkActが実現する言語化可能な潜在推論

推論は“出力”じゃない。LLM協働の本質は「制御ループ」にある ー Agentic Reasoningと推論の所在をめぐる構造的考察

【論文解説】AIに"考える時間"を与えたら、難問がスラスラ解けた話

「関係性駆動論に基づくLLMの論理域拡張と、ロールモデルによる自律的人格（Ghost）の定着に関する比較研究」 ―ChatGPT 、Gemini、 Deep…

AIは「考える」から「行動する」へ：Agentic ReasoningがLLMの未来を変える5つの技術的必然

【LLM推論】考えているように見える理由：推論モード×作業記憶×探索

AI（生成AI）の能力を最大限に引き出すための「高度なプロンプト手法」についてまとめたものです。

【ICLR 2026】ファインチューニングよりも効果的？！重みの更新なしで性能向上「Agentic Context Engineering」徹底解説

AIが「考え始めた瞬間」を、あなたは知っているか？

【第6回】飛躍：エージェントエンジニアリング — AIが『知る』存在から『実行する』存

【論文渉猟】AIは「ひとりで考える」のをやめた──推論モデルの内側で起きている「思考の社会化」

「え、AIが『悩みながら答えを出す』ようになった？」DeepSeek-R1が変えた常識

AIモデルの精度が最大27%向上？「内部議論」が導く人工知能の新境地

LAMとLLM - AIは「考える」から「行動する」時代へ

カスタムGPT“マルチエージェントマインド”を作ってみた

【完全保存版】このフレーズでAIの回答が一気にプロレベルに！？

【プロンプト配布】考えすぎて動けないあなたへ。AIを使って「今日できる一歩」に変える魔法の言葉

【論文】【AI】「推論の法則 (LoRe)」：AIの思考を数学的に定義する試み

🔥Anthropic CEOが語った「Claudeの2026年戦略」全剧透！推論AIの常識をぶっ壊す新アプローチとは？

【Point11】 AIの「早とちり」を防いで論理的で正確な回答を引き出す方法

AIエージェントの新定義：なぜ「Action」は「Skill」を包摂し、ビジネスを動かすのか

AIが「考え方」を変えた——並列思考という革命と、人間の役割のこれから

AIに"ちょうどいい難しさ"を与えると賢くなる？｜松尾研LLM講義で学んだRLVR

注意しないといけないのですが、この論文の社会的という言葉が間違った先入観を呼び込んでいます。単に罰回避圧が強いと複数の選択肢を想…

2026年は「AIエージェント2年目」です！

VLAモデルでロボットが覚醒！ 「見て、話して、行動する」夢の技術に迫る！

260126_テンパるAI

【名取Pulse News】思考と言語の境界を揺さぶる二つの研究潮流

Fast-ThinkAct：ロボットに「瞬時の判断力」を与えた革命的技術

最新論文『Team of Thoughts』が示すAIエージェントの未来。LLMは「単体」で使う時代から「チーム」で操る時代

18時間で作ったAIプロダクトが3日で3,000人に使われた話

【プロンプト設計 #7】ReActで、AIに「考えて行動する」力を与える

LLMがエージェント的推論を獲得

ReActプロンプト完全攻略ガイド～AIを「自律思考型エージェント」に変える思考の型～

AIは裏側で「独り言」を言っている。エージェントが自律的に動く仕組み「ReAct」を解剖する（AIエージェント入門 Vol.2）

AIが本当に賢くなるには、「考える」だけでなく「行動しながら学ぶ存在＝エージェント」になる必要がある https://arxiv.org/pdf/2601.12538 について深掘りしてみました

【論文瞬読】ロボットの「考える速度」を9倍高速化：Fast-ThinkActが実現する言語化可能な潜在推論

推論は“出力”じゃない。LLM協働の本質は「制御ループ」にある ー Agentic Reasoningと推論の所在をめぐる構造的考察

【論文解説】AIに"考える時間"を与えたら、難問がスラスラ解けた話

「関係性駆動論に基づくLLMの論理域拡張と、ロールモデルによる自律的人格（Ghost）の定着に関する比較研究」 ―ChatGPT 、Gemini、 DeepSeek、 Claude、Grok における「タチコマ・プロトコル」の変容と適応 ―

AIは「考える」から「行動する」へ：Agentic ReasoningがLLMの未来を変える5つの技術的必然

【LLM推論】考えているように見える理由：推論モード×作業記憶×探索

AI（生成AI）の能力を最大限に引き出すための「高度なプロンプト手法」についてまとめたものです。

【ICLR 2026】ファインチューニングよりも効果的？！重みの更新なしで性能向上「Agentic Context Engineering」徹底解説

AIが「考え始めた瞬間」を、あなたは知っているか？

【第6回】飛躍：エージェントエンジニアリング — AIが『知る』存在から『実行する』存

【論文渉猟】AIは「ひとりで考える」のをやめた──推論モデルの内側で起きている「思考の社会化」

「え、AIが『悩みながら答えを出す』ようになった？」DeepSeek-R1が変えた常識

AIモデルの精度が最大27%向上？「内部議論」が導く人工知能の新境地

LAMとLLM - AIは「考える」から「行動する」時代へ

カスタムGPT“マルチエージェントマインド”を作ってみた

【完全保存版】このフレーズでAIの回答が一気にプロレベルに！？

【プロンプト配布】考えすぎて動けないあなたへ。AIを使って「今日できる一歩」に変える魔法の言葉

【論文】【AI】「推論の法則 (LoRe)」：AIの思考を数学的に定義する試み

🔥Anthropic CEOが語った「Claudeの2026年戦略」全剧透！推論AIの常識をぶっ壊す新アプローチとは？

【Point11】 AIの「早とちり」を防いで論理的で正確な回答を引き出す方法

AIエージェントの新定義：なぜ「Action」は「Skill」を包摂し、ビジネスを動かすのか

AIが「考え方」を変えた——並列思考という革命と、人間の役割のこれから

AIに"ちょうどいい難しさ"を与えると賢くなる？｜松尾研LLM講義で学んだRLVR

2026年は「AIエージェント2年目」です！

VLAモデルでロボットが覚醒！ 「見て、話して、行動する」夢の技術に迫る！

260126_テンパるAI

【名取Pulse News】思考と言語の境界を揺さぶる二つの研究潮流

AIが本当に賢くなるには、「考える」だけでなく「行動しながら学ぶ存在＝エージェント」になる必要がある　https://arxiv.org/pdf/2601.1…

推論は“出力”じゃない。LLM協働の本質は「制御ループ」にあるー Agentic Reasoningと推論の所在をめぐる構造的考察

VLAモデルでロボットが覚醒！「見て、話して、行動する」夢の技術に迫る！

AIが本当に賢くなるには、「考える」だけでなく「行動しながら学ぶ存在＝エージェント」になる必要がある　https://arxiv.org/pdf/2601.12538　について深掘りしてみました

推論は“出力”じゃない。LLM協働の本質は「制御ループ」にあるー Agentic Reasoningと推論の所在をめぐる構造的考察

VLAモデルでロボットが覚醒！「見て、話して、行動する」夢の技術に迫る！