#추론 — difai

Anthropic Claude 3.7 Sonnet의 하이브리드 추론(표준+확장) 모드와 extended thinking의 실무 임팩트를 분석합니다.

2026年3月25日 · 8分钟

DeepSeek에서 제안한 GRPO 알고리즘과 RL 기반 LLM 추론 훈련의 최신 동향을 분석합니다.

2025年11月21日 · 8分钟

Claude 3.7 Sonnet의 Extended Thinking 기능은 일반 모드와 추론 모드를 하이브리드로 제공합니다.

2025年2月9日 · 6分钟

추론 시 더 많은 연산을 투입하면 모델 성능이 향상되는 Test-Time Compute Scaling을 분석합니다.

2024年8月25日 · 8分钟

Tree of Thoughts는 LLM이 여러 추론 경로를 탐색하고 평가하여 더 나은 해답을 찾는 프레임워크입니다.

2023年6月21日 · 6分钟

ReAct는 LLM이 추론(Reasoning)과 행동(Acting)을 교차하며 문제를 해결하는 프레임워크입니다.

2023年2月7日 · 6分钟

Chain-of-Thought는 '단계별로 생각해봐'라는 간단한 프롬프트로 LLM의 추론 능력을 대폭 향상시킵니다.

2021年12月18日 · 8分钟