#추론
추론 태그가 붙은 모든 글
Anthropic Claude 3.7 Sonnet의 하이브리드 추론(표준+확장) 모드와 extended thinking의 실무 임팩트를 분석합니다.
DeepSeek에서 제안한 GRPO 알고리즘과 RL 기반 LLM 추론 훈련의 최신 동향을 분석합니다.
Claude 3.7 Sonnet의 Extended Thinking 기능은 일반 모드와 추론 모드를 하이브리드로 제공합니다.
추론 시 더 많은 연산을 투입하면 모델 성능이 향상되는 Test-Time Compute Scaling을 분석합니다.
Tree of Thoughts는 LLM이 여러 추론 경로를 탐색하고 평가하여 더 나은 해답을 찾는 프레임워크입니다.
ReAct는 LLM이 추론(Reasoning)과 행동(Acting)을 교차하며 문제를 해결하는 프레임워크입니다.
Chain-of-Thought는 '단계별로 생각해봐'라는 간단한 프롬프트로 LLM의 추론 능력을 대폭 향상시킵니다.