논문: The Claude 3.5 Model Family 저자: Anthropic 링크: https://www.anthropic.com/news/claude-3-5-sonnet
논문 핵심
Claude 3.5 Sonnet은 GPT-4o와 동등하거나 상회하는 벤치마크를 기록하면서도, Anthropic의 Constitutional AI(CAI) 기반 안전성 프레임워크를 한층 강화했습니다.
주요 성능
"Claude 3.5 Sonnet sets new industry benchmarks for graduate-level reasoning and coding."
- MMLU: 88.7% (GPT-4o 대비 유사)
- HumanEval: 92.0% (코드 생성 최고 수준)
- Graduate-level QA: 기존 모든 모델 상회
- 비전 이해: 차트, 문서, 이미지 해석 강점
Constitutional AI 발전
Claude의 안전성 접근법은 RLHF와 달리, AI 자체가 원칙에 따라 자기 출력을 평가하고 수정합니다:
- 헌법(원칙) 정의
- AI가 자체 출력을 원칙에 비추어 비평
- 비평 기반으로 출력 수정
- 수정된 데이터로 학습
실무 시사점
Claude 3.5 Sonnet은 코드 생성과 분석 태스크에서 특히 강한 면모를 보입니다. 기업 환경에서 안전성이 중요한 경우, CAI 기반의 예측 가능한 행동 패턴은 큰 장점입니다.