PickleeAI와 개발, 오늘 볼 변화만

홈 읽을거리 아카이브

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

읽을거리

2026년 4월 14일

SuperGemma4-26B MLX 4-bit v2

Apple Silicon용 Gemma 4 26B 기반 MLX 4-bit 모델 카드. 텍스트 중심 로컬 에이전트 작업을 겨냥한 빠른 추론형 변형으로 소개된다.

본문 읽기 원문 보기

발행일

2026년 4월 14일

업데이트

2026년 4월 14일

주제

개요

Gemma 4 26B 기반의 Apple Silicon용 MLX 4-bit 모델 카드다. 텍스트 중심 로컬 에이전트 작업과 코딩, 툴 사용 시나리오를 강조한다.

핵심 포인트

Base model은 google/gemma-4-26B-A4B-it
MLX 4-bit 포맷으로 제공
로컬 에이전트, 코딩, 한국어 프롬프트 성능을 강조

볼 때 주의

공식 베이스 모델이 아니라 변형 모델 카드임
성능 수치는 업로더 기준 비교이므로 환경별 검증이 필요함
Apple Silicon MLX 환경 전제가 강함

이어 읽기

관련 읽을거리

2026년 4월 26일Nemotron-Personas-Korea — 한국 실제 분포 기반 합성 페르소나 데이터셋NVIDIA가 공개한 한국어 합성 페르소나 데이터셋으로, 한국의 공개 통계와 지역·직업·교육 등 사회적 분포를 바탕으로 100만 개 규모의 페르소나 레코드를 구성한 자료다. 한국어 모델 학습과 시뮬레이션에서 한국형 맥락을 반영하는 데 참고할 수 있다. 소버린 AI, 한국어 LLM 학습, 합성 데이터 다양성 확대 관점에서 볼 만하다. 영어권 중심 페르소나 데이터셋으로는 놓치기 쉬운 지역성과…2026년 4월 6일AirLLM — 4GB GPU에서 70B LLM 돌리는 초경량 추론 라이브러리양자화나 증류 없이 70B 모델을 4GB GPU에서, Llama 3.1 405B를 8GB VRAM에서 실행할 수 있는 추론 최적화 라이브러리. 계층별 모델 분해(layer-wise decomposition)로 필요한 레이어만 메모리에 로드하는 방식. 블록 단위 양자화 압축으로 3배 속도 향상. GitHub 스타 15k+.2026년 4월 5일Google Gemma 4 공개 — Apache 2.0·256K 컨텍스트·멀티모달, 오픈 에이전틱 모델의 새 기준Google이 4월 2~3일 Gemma 4를 Apache 2.0 라이선스로 공개했다. Effective 2B·4B·26B MoE·31B Dense 네 가지 크기로 제공되며, 256K 토큰 컨텍스트, 비전·오디오 네이티브 멀티모달, 140개 이상 언어를 지원한다.2026년 4월 5일PrismML, Bonsai 1-bit LLM 출시 — 1GB 메모리로 8B 추론, 엣지 AI의 현실화PrismML이 4월 3일 스텔스에서 등장해 세계 최초 상업적으로 실행 가능한 1-bit LLM 패밀리 Bonsai를 Apache 2.0으로 공개했다. 플래그십인 Bonsai 8B는 1.15GB 메모리에 구동되며, FP16 8B 모델 대비 14배 소형·8배 빠른 속도·5배 낮은 에너지 소비를 달성하면서 추론 품질은 동급 수준을 유지한다.