Claude 3.7 Sonnet: 깊이 생각하는 AI

2025년 2월, Anthropic이 Claude 3.7 Sonnet을 출시했습니다. 최대의 특징은 Extended Thinking — 복잡한 문제에 대해 더 오랜 시간 사고하는 기능입니다.

Extended Thinking

o1과 유사하게, Claude 3.7은 복잡한 문제에서 내부적으로 추론 과정을 거칩니다. 차이점은 사고 과정을 사용자에게 공개한다는 것입니다.

벤치마크 성과

  • SWE-bench Verified: 70.3% — 코딩 벤치마크 사상 최고
  • 수학: AIME 2024에서 80% 정확도
  • 과학: 대학원 수준 물리/화학 문제 해결

Hybrid 모드

일반 질문은 빠르게, 복잡한 추론은 깊게 — Extended Thinking을 상황에 따라 자동 전환합니다.

AI 추론 경쟁의 현황

OpenAI o1/o3 ← 추론 특화 모델의 선두
DeepSeek R1 ← 오픈소스 추론 모델
Claude 3.7  ← 범용 + 추론 하이브리드
Gemini 2.0  ← Google의 추론 모델

2025년은 "얼마나 깊이 생각할 수 있는가"가 AI 모델의 핵심 경쟁력이 되는 해입니다.