읽을거리2026년 3월 29일Google TurboQuant: KV-cache 6배 압축으로 LLM 메모리 혁신, ICLR 2026 발표Google이 ICLR 2026에서 TurboQuant를 발표했다. KV-cache를 채널당 3.5비트로 압축해 메모리 사용량을 6배 줄이는 소프트웨어 레벨의 LLM 효율화 기법이다.본문 읽기원문 보기