#LLM
LLM 태그가 붙은 모든 글
에이전트 제어의 고수준 로직을 편집 가능한 자연어로 표현하는 Natural-Language Agent Harnesses(NLAHs)와, 이 하네스를 명시적 계약·지속 아티팩트·경량…
RAG의 최신 연구 동향을 정리하고, 검색 품질과 생성 정확도를 높이는 실무 전략을 분석합니다.
Google이 PaLM(Pathways Language Model)을 발표하며 GPT-3의 3배 규모를 달성했습니다.
Google의 PaLM은 540B 파라미터로 다양한 벤치마크에서 SOTA를 달성하고, 특히 추론 능력에서 도약을 보였습니다.
DeepMind의 Chinchilla 논문이 '모델을 키우기보다 데이터를 늘려라'는 새로운 Scaling Law를 제시했습니다.
모델 크기만 키우는 것이 아닌, 데이터와 연산의 균형이 중요하다는 초기 연구들을 살펴봅니다.
OpenAI가 발표한 Scaling Law 논문은 모델 크기, 데이터, 연산량과 성능의 관계를 명확히 규명했습니다.