#SSM
SSM 태그가 붙은 모든 글
Mamba-2, RWKV, Griffin 등 Attention을 대체하는 아키텍처들의 2024년 발전을 종합 분석합니다.
Mamba는 Selective State Space Model로, Transformer와 경쟁하면서 시퀀스 길이에 선형적으로 확장됩니다.