论文: The Claude 3.5 Model Family 作者: Anthropic 链接: https://www.anthropic.com/news/claude-3-5-sonnet
论文要点
Claude 3.5 Sonnet在记录与GPT-4o相当或更高的基准的同时,进一步加强了Anthropic的Constitutional AI (CAI)基础安全框架。
主要性能
“Claude 3.5 Sonnet在研究生级推理和编码方面设立了新的行业基准。”
- MMLU: 88.7% (与GPT-4o相似)
- HumanEval: 92.0% (代码生成最高水平)
- Graduate-level QA: 超越所有现有模型
- 视觉理解: 擅长图表、文档、图像解读
Constitutional AI发展
Claude的安全性方法不同于RLHF,AI本身根据原则评估和修改其输出:
- 定义宪法(原则)
- AI根据原则批评自身输出
- 基于批评修改输出
- 用修改后的数据进行学习
实际意义
Claude 3.5 Sonnet在代码生成和分析任务方面表现尤为出色。在企业环境中,如果安全性很重要,基于CAI的可预测行为模式是一个很大的优势。