PickleeAI와 개발, 오늘 볼 변화만

홈 읽을거리 아카이브

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

읽을거리

2026년 3월 27일

Google TurboQuant, LLM KV 캐시 6배 압축 — 정확도 손실 0%

Google Research가 LLM의 KV(Key-Value) 캐시를 3비트로 압축해 메모리를 6배 절감하면서도 정확도 손실이 전혀 없는 알고리즘 TurboQuant를 공개했다. Nvidia H100 기준 Attention 연산 속도 최대 8배 향상을 기록하며 ICLR 2026에 채택됐다.

본문 읽기 원문 보기

발행일

2026년 3월 27일

업데이트

2026년 3월 27일

주제

이어 읽기

관련 읽을거리

2026년 6월 27일GPT-5.6 Sol preview - frontier model releases become policy-gated infrastructure decisionsOpenAI는 2026년 6월 26일 GPT-5.6 series의 limited preview를 발표하며 Sol, Terra, Luna 3개 tier와 새로운 max reasoning effort, subagent 기반 ultra mode를 공개했다. Sol은 Terminal-Bench 2.1, GeneBench v1, ExploitBench, ExploitGym 같은 장시간…2026년 6월 25일GLM-5.2 - open long-context models push agentic coding toward 1M-token workspacesZ.AI는 GLM-5.2를 공개하며 1M-token context, flexible effort levels, MIT license, long-horizon coding benchmark 성능을 전면에 내세웠다. 공개 글은 IndexShare로 1M context에서 per-token FLOPs를 2.9x 줄이고, Terminal Bench 2.1 81.0, SWE-bench Pro…2026년 6월 24일FFASR Leaderboard - voice AI benchmarks move from clean speech to far-field realityHugging Face와 Treble Technologies는 Far-Field ASR(FFASR) Leaderboard를 공개해 ASR 모델을 reverberation, background noise, competing speech, room acoustics 같은 실제 far-field 조건에서 비교할 수 있게 했다. 기존 clean/near-field benchmark 중심 평가가…2026년 6월 24일Krea 2 technical report - open image models compete on creative control, not only fidelityKrea는 Krea 2 technical report를 공개하며 K2 Raw와 K2 Turbo 계열의 open-weights text-to-image foundation model을 설명했다. 보고서는 data curation, diffusion transformer architecture, multi-stage training, prompt expander, style-reference…