論文: ReAct: Synergizing Reasoning and Acting in Language Models 著者: Yao et al. (Princeton, Google Brain) リンク: https://arxiv.org/abs/2210.03629
論文の要点
ReActはLLMが思考(Thought) → 行動(Action) → 観察(Observation)を繰り返しながら複雑な問題を解決するフレームワークです。
ReActパターン
"We propose ReAct, a general paradigm that synergizes reasoning and acting with language models."
Thought: 韓国の首都を知る必要があり、その都市の人口を探す必要がある。
Action: Search[韓国の首都]
Observation: ソウルは大韓民国の首都である。
Thought: ソウルの人口を検索する必要がある。
Action: Search[ソウル 人口]
Observation: ソウルの人口は約950万人である。
Thought: 答えがわかった。
Action: Finish[約950万人]
従来の方法との比較
- CoTのみ: 推論はするが外部情報の活用不可 → 幻覚のリスク
- Actionのみ: 行動はするが計画なし → 非効率的
- ReAct: 推論で計画 + 行動で情報収集 → 相互補完
実務上の示唆
ReActは現在LangChain、CrewAIなどのAIエージェントフレームワークの核心設計パターンです。企業のAIエージェントを構築する際、「モデルがどの順序で思考し行動するべきか」の答えをこの論文から見つけることができます。