论文: The Claude 3.5 Model Family 作者: Anthropic 链接: https://www.anthropic.com/news/claude-3-5-sonnet


论文要点

Claude 3.5 Sonnet在记录与GPT-4o相当或更高的基准的同时,进一步加强了Anthropic的Constitutional AI (CAI)基础安全框架。

主要性能

“Claude 3.5 Sonnet在研究生级推理和编码方面设立了新的行业基准。”

  • MMLU: 88.7% (与GPT-4o相似)
  • HumanEval: 92.0% (代码生成最高水平)
  • Graduate-level QA: 超越所有现有模型
  • 视觉理解: 擅长图表、文档、图像解读

Constitutional AI发展

Claude的安全性方法不同于RLHF,AI本身根据原则评估和修改其输出

  1. 定义宪法(原则)
  2. AI根据原则批评自身输出
  3. 基于批评修改输出
  4. 用修改后的数据进行学习

实际意义

Claude 3.5 Sonnet在代码生成和分析任务方面表现尤为出色。在企业环境中,如果安全性很重要,基于CAI的可预测行为模式是一个很大的优势。