PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

읽을거리

2026년 3월 28일

Google TurboQuant: LLM KV-Cache 6배 압축 달성, 메모리 반도체 시장 직격

Google이 ICLR 2026에서 발표한 TurboQuant 양자화 기술은 LLM의 KV-Cache를 채널당 3.5비트로 압축하여 메모리 사용량을 최대 6배 감소시키면서도 모델 품질을 유지("absolute quality neutrality")하는 데 성공했다. 이 결과로 Micron 등 AI 메모리 공급업체 주가가 즉각 하락했다.

본문 읽기원문 보기

발행일

2026년 3월 28일

업데이트

2026년 3월 28일

주제

AI
모델
트렌드
오픈소스
원문 보기

이어 읽기

관련 읽을거리

전체 보기
2026년 6월 25일GLM-5.2 - open long-context models push agentic coding toward 1M-token workspacesZ.AI는 GLM-5.2를 공개하며 1M-token context, flexible effort levels, MIT license, long-horizon coding benchmark 성능을 전면에 내세웠다. 공개 글은 IndexShare로 1M context에서 per-token FLOPs를 2.9x 줄이고, Terminal Bench 2.1 81.0, SWE-bench Pro…2026년 6월 24일Krea 2 technical report - open image models compete on creative control, not only fidelityKrea는 Krea 2 technical report를 공개하며 K2 Raw와 K2 Turbo 계열의 open-weights text-to-image foundation model을 설명했다. 보고서는 data curation, diffusion transformer architecture, multi-stage training, prompt expander, style-reference…2026년 5월 17일Local open models on laptops — 오픈모델 성능 향상이 하드웨어보다 아키텍처 혁신에 더 크게 의존하기 시작Hugging Face 커뮤니티 글은 2026년 5월 11일, 128GB MacBook Pro 기준 로컬에서 구동 가능한 최상위 오픈웨이트 모델의 성능이 2년 사이 Artificial Analysis Intelligence Index 10 → 47로 상승했다고 정리했다. 같은 기간 RAM 상한은 128GB로 거의 고정됐고, 향상의 핵심 동인은 sparse MoE, mixed…2026년 5월 11일EMO — MoE가 실제 배포 가능한 모듈형 모델로 진화할 수 있음을 보여준 AllenAI의 오픈 릴리즈AllenAI는 2026년 5월 8일 EMO를 공개했다. 이 모델은 1B active / 14B total parameter, 128 experts, 1T tokens 규모의 MoE를 문서 단위 shared expert pool 제약으로 학습해, 전체 expert의 12.5%만 사용해도 near full-model 성능을 유지하도록 설계됐다.