dif
ai
프롬프트
튜토리얼
벤치마크
블로그
한
EN
한
日
中
#최적화
#최적화
최적화 태그가 붙은 모든 글
FlashAttention: Attention 연산의 속도 혁명
FlashAttention은 GPU 메모리 계층을 최적화하여 Attention 연산을 2-4배 가속하고 메모리 사용을 줄입니다.
2022년 10월 15일
· 6분