PaLM: Google 的雄心之作
2022年4月,Google Research 宣布了 PaLM(Pathways Language Model)。它具有5400亿参数,是 GPT-3 的三倍规模。
主要成就
PaLM 在多个基准测试中刷新了现有的 SOTA,尤其在 推理能力方面表现出色:
- 数学问题解决性能大幅提升
- 代码生成和调试能力
- 常识推理基准测试中接近人类水平
- 通过 Chain-of-thought 提示实现复杂推理
Pathways 系统
PaLM 是在 Google 的 Pathways 系统上训练的。使用 6,144 个 TPU v4 芯片进行高效的分布式训练。
Chain-of-Thought 的出现
与 PaLM 一起受到关注的是 Chain-of-Thought(CoT) 提示。仅通过“逐步思考”这样的简单指令,模型的推理能力就能大幅提升。
这之后成为所有 LLM 的标准技术。