Toolformer와 ReAct: AI Agent의 이론적 기반

論文: ReAct: Synergizing Reasoning and Acting in Language Models 著者: Yao et al. (Princeton, Google Brain) リンク: https://arxiv.org/abs/2210.03629

論文の要点

ReActはLLMが思考(Thought) → 行動(Action) → 観察(Observation)を繰り返しながら複雑な問題を解決するフレームワークです。

ReActパターン

"We propose ReAct, a general paradigm that synergizes reasoning and acting with language models."

Thought: 韓国の首都を知る必要があり、その都市の人口を探す必要がある。
Action: Search[韓国の首都]
Observation: ソウルは大韓民国の首都である。
Thought: ソウルの人口を検索する必要がある。
Action: Search[ソウル 人口]
Observation: ソウルの人口は約950万人である。
Thought: 答えがわかった。
Action: Finish[約950万人]

従来の方法との比較

CoTのみ: 推論はするが外部情報の活用不可 → 幻覚のリスク
Actionのみ: 行動はするが計画なし → 非効率的
ReAct: 推論で計画 + 行動で情報収集 → 相互補完

実務上の示唆

ReActは現在LangChain、CrewAIなどのAIエージェントフレームワークの核心設計パターンです。企業のAIエージェントを構築する際、「モデルがどの順序で思考し行動するべきか」の答えをこの論文から見つけることができます。