#GPU

GPU 태그가 붙은 모든 글

FlashAttention: Attention 연산의 속도 혁명

FlashAttention은 GPU 메모리 계층을 최적화하여 Attention 연산을 2-4배 가속하고 메모리 사용을 줄입니다.

· 6分

AI 반도체 전쟁: GPU에서 TPU, 전용 칩까지

AI 학습과 추론을 위한 하드웨어 경쟁이 치열해지고 있습니다.

· 4分