Claude 3.7 Sonnet: 깊이 생각하는 AI
2025년 2월, Anthropic이 Claude 3.7 Sonnet을 출시했습니다. 최대의 특징은 Extended Thinking — 복잡한 문제에 대해 더 오랜 시간 사고하는 기능입니다.
Extended Thinking
o1과 유사하게, Claude 3.7은 복잡한 문제에서 내부적으로 추론 과정을 거칩니다. 차이점은 사고 과정을 사용자에게 공개한다는 것입니다.
벤치마크 성과
- SWE-bench Verified: 70.3% — 코딩 벤치마크 사상 최고
- 수학: AIME 2024에서 80% 정확도
- 과학: 대학원 수준 물리/화학 문제 해결
Hybrid 모드
일반 질문은 빠르게, 복잡한 추론은 깊게 — Extended Thinking을 상황에 따라 자동 전환합니다.
AI 추론 경쟁의 현황
OpenAI o1/o3 ← 추론 특화 모델의 선두
DeepSeek R1 ← 오픈소스 추론 모델
Claude 3.7 ← 범용 + 추론 하이브리드
Gemini 2.0 ← Google의 추론 모델
2025년은 "얼마나 깊이 생각할 수 있는가"가 AI 모델의 핵심 경쟁력이 되는 해입니다.