Blog

Insights on AI adoption and utilization

Natural-Language Agent Harnesses (arXiv:2603.25723) 상세 분석

에이전트 제어의 고수준 로직을 편집 가능한 자연어로 표현하는 Natural-Language Agent Harnesses(NLAHs)와, 이 하네스를 명시적 계약·지속 아티팩트·경량…

· 20min

클로드 코드 요약

유출된 클로드 코드를 분석하고 요약했습니다.

· 20min

TurboQuant 구현하기 (5편) - 구현코드

소스코드 구현하기

· 11min

TurboQuant 구현하기 (4편) — QJL + PolarQuant, 드디어 TurboQuant 완성

이번 편에서는 두 모듈을 하나의 TurboQuant로 조립하고, KV Cache에 실제로 적용합니다.

· 20min

TurboQuant 구현하기 (3편) — PolarQuant, 극좌표로 양자화 상수를 없애다

이번 편에서는 TurboQuant의 두 번째 핵심 블록인 PolarQuant 를 다룹니다.

· 20min

TurboQuant 구현하기 (2편) — QJL, 1-bit으로 내적을 추정한다

이번 편에서는 TurboQuant의 첫 번째 핵심 블록인 QJL(Quantized Johnson-Lindenstrauss)을 이해합니다.

· 20min

TurboQuant 구현하기 (1편) — KV Cache 병목, 왜 새로운 압축이 필요한가

Google Research가 ICLR 2026에 발표한 TurboQuant를 직접 구현해보는 시리즈입니다.

· 15min

TurboQuant: 3비트 KV 캐시 양자화로 LLM 추론 메모리를 6배 줄이다

Google Research의 TurboQuant이 training-free 벡터 양자화로 KV 캐시를 3비트까지 압축하면서도 정확도를 유지하는 방법을 분석합니다.

· 9min

Claude 3.7 Sonnet과 하이브리드 추론의 미래

Anthropic Claude 3.7 Sonnet의 하이브리드 추론(표준+확장) 모드와 extended thinking의 실무 임팩트를 분석합니다.

· 8min

한국 기업의 AI Agent 도입 전략

한국 기업들이 AI Agent를 성공적으로 도입하기 위한 실전 전략과 사례를 공유합니다.

· 6min

Gemini 2.0과 구글의 AI 에이전트 전략

Google Gemini 2.0의 네이티브 도구 사용 능력과 에이전트 중심 AI 전략을 분석합니다.

· 8min

AI Agent 플랫폼 비교: 기업을 위한 가이드

주요 AI Agent 플랫폼을 비교하고, 기업에 적합한 선택 기준을 제시합니다.

· 5min