#SSM

SSM 태그가 붙은 모든 글

Attention is Not All You Need: State Space Model의 도전

Mamba-2, RWKV, Griffin 등 Attention을 대체하는 아키텍처들의 2024년 발전을 종합 분석합니다.

· 7分

Mamba: 선형 복잡도의 시퀀스 모델

Mamba는 Selective State Space Model로, Transformer와 경쟁하면서 시퀀스 길이에 선형적으로 확장됩니다.

· 5分