Deprecated: Parsedown::blockSetextHeader(): Implicitly marking parameter $Block as nullable is deprecated, the explicit nullable type must be used instead in /difai/www/core/Parsedown.php on line 715 Deprecated: Parsedown::blockTable(): Implicitly marking parameter $Block as nullable is deprecated, the explicit nullable type must be used instead in /difai/www/core/Parsedown.php on line 853 Google PaLM: 5,400억 파라미터의 거대 모델

博客

Google PaLM：5,400亿参数的巨大模型

Google宣布了PaLM（Pathways Language Model），其规模达到了GPT-3的3倍。

Scott K · 2022年5月15日 · 约 4分钟 · 浏览 7,578

PaLM: Google 的雄心之作

2022年4月，Google Research 宣布了 PaLM(Pathways Language Model)。它具有5400亿参数，是 GPT-3 的三倍规模。

主要成就

PaLM 在多个基准测试中刷新了现有的 SOTA，尤其在 推理能力方面表现出色：

数学问题解决性能大幅提升
代码生成和调试能力
常识推理基准测试中接近人类水平
通过 Chain-of-thought 提示实现复杂推理

Pathways 系统

PaLM 是在 Google 的 Pathways 系统上训练的。使用 6,144 个 TPU v4 芯片进行高效的分布式训练。

Chain-of-Thought 的出现

与 PaLM 一起受到关注的是 Chain-of-Thought(CoT) 提示。仅通过“逐步思考”这样的简单指令，模型的推理能力就能大幅提升。

这之后成为所有 LLM 的标准技术。

#Google #LLM #PaLM

如有AI导入相关问题，请随时联系我们。

contact@difai.kr

已复制