PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

읽을거리

2026년 4월 14일

SuperGemma4-26B MLX 4-bit v2

Apple Silicon용 Gemma 4 26B 기반 MLX 4-bit 모델 카드. 텍스트 중심 로컬 에이전트 작업을 겨냥한 빠른 추론형 변형으로 소개된다.

본문 읽기원문 보기

발행일

2026년 4월 14일

업데이트

2026년 4월 14일

주제

AI
모델
무료
원문 보기

개요

Gemma 4 26B 기반의 Apple Silicon용 MLX 4-bit 모델 카드다. 텍스트 중심 로컬 에이전트 작업과 코딩, 툴 사용 시나리오를 강조한다.

핵심 포인트

  • Base model은 google/gemma-4-26B-A4B-it
  • MLX 4-bit 포맷으로 제공
  • 로컬 에이전트, 코딩, 한국어 프롬프트 성능을 강조

볼 때 주의

  • 공식 베이스 모델이 아니라 변형 모델 카드임
  • 성능 수치는 업로더 기준 비교이므로 환경별 검증이 필요함
  • Apple Silicon MLX 환경 전제가 강함

이어 읽기

관련 읽을거리

전체 보기
2026년 4월 26일Nemotron-Personas-Korea — 한국 실제 분포 기반 합성 페르소나 데이터셋NVIDIA가 공개한 한국어 합성 페르소나 데이터셋으로, 한국의 공개 통계와 지역·직업·교육 등 사회적 분포를 바탕으로 100만 개 규모의 페르소나 레코드를 구성한 자료다. 한국어 모델 학습과 시뮬레이션에서 한국형 맥락을 반영하는 데 참고할 수 있다. 소버린 AI, 한국어 LLM 학습, 합성 데이터 다양성 확대 관점에서 볼 만하다. 영어권 중심 페르소나 데이터셋으로는 놓치기 쉬운 지역성과…2026년 4월 6일AirLLM — 4GB GPU에서 70B LLM 돌리는 초경량 추론 라이브러리양자화나 증류 없이 70B 모델을 4GB GPU에서, Llama 3.1 405B를 8GB VRAM에서 실행할 수 있는 추론 최적화 라이브러리. 계층별 모델 분해(layer-wise decomposition)로 필요한 레이어만 메모리에 로드하는 방식. 블록 단위 양자화 압축으로 3배 속도 향상. GitHub 스타 15k+.2026년 4월 5일Google Gemma 4 공개 — Apache 2.0·256K 컨텍스트·멀티모달, 오픈 에이전틱 모델의 새 기준Google이 4월 2~3일 Gemma 4를 Apache 2.0 라이선스로 공개했다. Effective 2B·4B·26B MoE·31B Dense 네 가지 크기로 제공되며, 256K 토큰 컨텍스트, 비전·오디오 네이티브 멀티모달, 140개 이상 언어를 지원한다.2026년 4월 5일PrismML, Bonsai 1-bit LLM 출시 — 1GB 메모리로 8B 추론, 엣지 AI의 현실화PrismML이 4월 3일 스텔스에서 등장해 세계 최초 상업적으로 실행 가능한 1-bit LLM 패밀리 Bonsai를 Apache 2.0으로 공개했다. 플래그십인 Bonsai 8B는 1.15GB 메모리에 구동되며, FP16 8B 모델 대비 14배 소형·8배 빠른 속도·5배 낮은 에너지 소비를 달성하면서 추론 품질은 동급 수준을 유지한다.