PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

주제

#오픈소스

123개 읽을거리를 모았습니다.
2026년 6월 27일

DeepSpec - speculative decoding becomes an open production optimization stack

DeepSeek은 speculative decoding draft model을 훈련하고 평가하기 위한 MIT-licensed DeepSpec repository를 공개했다. README 기준 DeepSpec은 data preparation, draft model implementation, training, evaluation scripts를 포함하며 DSpark, DFlash,…

AI
오픈소스
읽기
2026년 6월 25일

GLM-5.2 - open long-context models push agentic coding toward 1M-token workspaces

Z.AI는 GLM-5.2를 공개하며 1M-token context, flexible effort levels, MIT license, long-horizon coding benchmark 성능을 전면에 내세웠다. 공개 글은 IndexShare로 1M context에서 per-token FLOPs를 2.9x 줄이고, Terminal Bench 2.1 81.0, SWE-bench Pro…

AI
모델
읽기
2026년 6월 24일

Kog Laneformer 2B - latency-first coding models move architecture into the serving layer

Kog는 Hugging Face에 Laneformer 2B의 weights와 model code를 공개했다. 이 모델은 2.3B parameter instruction-tuned coding model로, Delayed Tensor Parallelism과 lane-structured Transformer를 통해 batch-size-one decoding latency를 모델 아키텍처…

AI
모델
읽기
2026년 6월 24일

Krea 2 technical report - open image models compete on creative control, not only fidelity

Krea는 Krea 2 technical report를 공개하며 K2 Raw와 K2 Turbo 계열의 open-weights text-to-image foundation model을 설명했다. 보고서는 data curation, diffusion transformer architecture, multi-stage training, prompt expander, style-reference…

AI
모델
읽기
2026년 6월 24일

NVIDIA NeMo AutoModel - MoE fine-tuning gets a drop-in performance path for Transformers

NVIDIA와 Hugging Face는 Transformers v5 위에서 NeMo AutoModel을 사용해 MoE fine-tuning을 가속하는 방법을 공개했다. NeMo AutoModel은 Expert Parallelism, DeepEP fused all-to-all dispatch, TransformerEngine kernels를 추가해 같은 from_pretrained() 계열…

AI
개발도구
읽기
2026년 6월 23일

huggingface_hub weekly release CI - open-weight agents make release automation auditable

Hugging Face는 huggingface_hub를 4-6주 주기에서 weekly release로 바꾼 GitHub Actions 기반 release pipeline을 공개했다. OpenCode, GLM-5.2 open-weight model, HF Inference Providers, PyPI Trusted Publishing을 사용하되, release notes와…

AI
오픈소스
읽기
2026년 6월 23일

OpenAI Patch the Planet - AI-assisted security needs maintainer-controlled remediation loops

OpenAI는 Trail of Bits와 함께 Patch the Planet을 공개해 cURL, NATS Server, pyca/cryptography, Sigstore, aiohttp, Go, Python 등 주요 OSS 프로젝트에 AI-assisted security research와 human expert review를 결합한다. Daybreak/Codex Security 흐름은…

AI
OpenAI
읽기
2026년 6월 22일

Intel XPU Kernel Skill - coding agents optimize Triton kernels beyond CUDA-first defaults

Intel DCG AI Software와 OCTO Parallel Computing Lab은 Hugging Face Kernel Hub용 Intel XPU Kernel Skill을 공개했다. Xe-Forge 기반 CoVeR loop는 LLM이 Triton kernel을 생성, 검증, benchmark, refine하도록 만들며 Arc Pro B70에서 KernelBench Level-2…

AI
개발도구
읽기
2026년 6월 22일

PP-OCRv6 on Hugging Face - document AI stays specialized, small, and multilingual

PaddlePaddle은 Hugging Face에서 PP-OCRv6를 공개하며 1.5M, 7.7M, 34.5M parameter의 tiny/small/medium OCR tier를 제공한다고 밝혔다. medium/small tier는 50개 언어를 지원하고, medium은 자체 multi-scenario benchmark에서 detection Hmean 86.2%, recognition…

AI
모델
읽기
2026년 6월 22일

Reflection-SpaceX compute deal - open-source frontier AI hits a capacity wall

Nvidia-backed Reflection AI가 SpaceXAI의 Colossus 2 compute에 접근하는 대형 계약을 체결한 것으로 보도됐다. 계약 구조는 2026년 7월 1일부터 2029년까지 월 1.5억 달러, 총 약 USD 6.3B 규모로 알려졌고, Reflection은 GB300급 compute를 확보해 open-source frontier model 경쟁을 이어가려 한다.

AI
산업
읽기
2026년 6월 20일

JEP 401 Value Classes — Java object model이 identity-free domain value로 이동한다

OpenJDK JEP 401은 Java에 value classes and objects를 preview feature로 도입해, final fields만 갖고 object identity가 없는 domain value 프로그래밍 모델을 제공한다. 최근 Project Valhalla의 JDK 28 target 보도와 함께 Java의 장기 성능 병목인 객체 identity overhead가…

개발도구
트렌드
읽기
2026년 6월 12일

OpenEnv committee launch — open agent training이 harness별 튜닝에서 공유 environment protocol로 이동

Hugging Face는 2026년 6월 8일 OpenEnv가 Meta-PyTorch, Nvidia, Modal, Prime Intellect, Unsloth 등과 함께 위원회 기반 프로젝트로 전환됐다고 발표했다. OpenEnv는 터미널, 브라우저 등 agent execution environment를 표준 인터페이스로 노출하는 레이어로 정의되며,…

AI
에이전트
읽기
2026년 6월 10일

Cloudflare acquires VoidZero — AI 코딩 시대의 배포 스택이 framework 선택에서 execution path 통합으로 이동

Cloudflare는 2026년 6월 5일 Vite 생태계를 이끄는 VoidZero를 인수한다고 밝혔다. Vite, Vitest, Rolldown, Oxc를 Workers 플랫폼과 더 깊게 결합하고, D1·R2 같은 인프라를 intent-based 방식으로 자동 프로비저닝하는 방향을 제시했다.

AI
개발도구
읽기
2026년 6월 8일

Introducing Mellum2 — software engineering용 small expert model 경쟁이 giant general model에서 low-latency control layer로 이동

JetBrains는 2026년 6월 1일 Mellum2를 공개했다. 이 모델은 text·code 특화 12B Mixture-of-Experts 구조를 사용하며 token당 2.5B만 활성화해, routing·RAG·summarization·sub-agent 같은 latency-sensitive workload에서 2배 이상 빠른 추론을 목표로 한다.

AI
오픈소스
읽기
2026년 6월 7일

Ollama 0.30 — local AI 배포 경쟁이 모델 자체에서 runtime 호환성과 GPU 보편성으로 이동

Ollama는 2026년 6월 5일 Ollama 0.30을 공개하며 GGUF 호환성과 llama.cpp 통합을 강화했다. 발표에 따르면 NVIDIA GPU에서 최대 20% 빠른 처리량을 제공하고, Vulkan을 기본 활성화해 AMD·Intel까지 GPU 가속 범위를 넓혔으며, LFM·Prism·Unsloth 계열을 포함한 더 많은 모델을 즉시 실행할 수 있게 했다.

AI
오픈소스
읽기
2026년 6월 6일

IBM and Red Hat Project Lightwell — open source AI 시대의 공급망 보안이 clearinghouse 모델로 재편

IBM과 Red Hat은 2026년 5월 28일 Project Lightwell을 발표하며 open source software 보안을 위해 50억 달러와 2만 명 이상의 엔지니어를 투입하겠다고 밝혔다. 이 프로젝트는 enterprise clearinghouse를 통해 취약점 신고, 검증된 패치 배포, upstream disclosure를 조율하고 AI 기반 검증·테스트를 결합하는 모델이다.

AI
오픈소스
읽기
2026년 6월 6일

Introducing Gemma 4 12B — local multimodal agent 실행이 16GB급 엣지 하드웨어로 내려오다

Google은 2026년 6월 3일 Gemma 4 12B를 공개했다. 이 모델은 vision·audio를 별도 encoder 없이 LLM backbone에 직접 투입하는 unified multimodal 구조를 채택했고, 16GB급 VRAM 또는 unified memory에서도 구동 가능하도록 설계됐으며, Apache 2.0 라이선스로 공개됐다.

AI
모델
읽기
2026년 6월 5일

Supabase Series F — vibe coding이 backend를 demo layer에서 agentic production substrate로 밀어올리다

Supabase는 2026년 6월 5일 보도 기준 5억 달러 Series F를 유치했고, valuation은 약 105억 달러 post-money 수준으로 뛰었다. TechCrunch 보도에 따르면 지난 1년 사용량은 600% 이상 성장했고, 신규 database의 60% 이상이 어떤 형태로든 AI tool에 의해 생성되고 있으며, 사용자 수는 1천만 명에 근접했다.

AI
산업
읽기
2026년 6월 4일

Redis Iris — agent stack이 prompt tuning에서 context engine 아키텍처로 이동

Redis는 2026년 5월 18일 Redis Iris를 발표하며 agent failure의 핵심 원인을 모델 성능이 아니라 context layer의 분산·지연·낙후 문제로 규정했다. Iris는 Context Retriever, Agent Memory, Data Integration, LangCache, Redis Search 다섯 요소를 묶어…

AI
에이전트
읽기
2026년 6월 1일

Introducing Command A+ — sovereign enterprise AI가 폐쇄형 API 의존에서 배포 가능한 open model stack으로 이동

Cohere는 2026년 5월 20일 Command A+를 Apache 2.0으로 공개했다. 이 모델은 218B total·25B active의 MoE 구조, 128K 입력 컨텍스트, 텍스트·이미지·tool use를 지원하며 최소 2×H100 환경에서도 구동 가능한 enterprise용 open model이다.

AI
모델
읽기
2026년 6월 1일

NVIDIA Alpamayo 2 Super — autonomous driving이 perception stack에서 reasoning-first physical AI stack으로 이동

NVIDIA는 2026년 6월 1일 Alpamayo 2 Super를 공개했다. 이 모델은 32B 규모의 open reasoning vision-language-action model로, level 4 robotaxi 개발을 위해 perception·planning·action을 하나의 driving stack으로 묶고, 함께 AlpaGym·OmniDreams·NuRec 기반 agent…

AI
모델
읽기
2026년 5월 31일

Introducing Trusted Remote Execution: Policy-Enforced Scripts for AI Agents and Humans

AWS는 2026년 5월 4일 Trusted Remote Execution(Rex)을 오픈소스로 공개했다. Rex는 Rhai 스크립트가 host에 직접 접근하지 못하게 하고, 모든 시스템 작업을 Cedar policy로 승인한 뒤에만 실행하는 runtime으로, AI agent가 만든 스크립트도 동일한 정책 경계 안에서 동작한다.

AI
오픈소스
읽기
2026년 5월 30일

Introducing Search Toolkit — agent retrieval 경쟁이 RAG 데모에서 검색 파이프라인 운영력으로 이동

Mistral은 2026년 5월 28일 Search Toolkit을 public preview로 공개했다. 이 오픈소스 프레임워크는 ingestion, retrieval, evaluation을 하나의 공통 인터페이스로 묶고, BM25·dense retrieval·hybrid search와 recall, precision, MRR, NDCG 평가를 함께 제공한다.

AI
개발도구
읽기
2026년 5월 29일

Arm open-sources Metis — AI 보안 검증이 규칙 기반 스캐너에서 repo-context reasoning으로 이동

Arm은 2026년 5월 28일 Metis를 오픈소스로 공개했다. Metis는 source code·build files·documentation을 함께 읽는 RAG 기반 agentic AI security framework로, Arm 내부 130개 이상 소프트웨어 프로젝트에서 사용 중이며 true positive는 최대 10배 높이고 false positive는 약 50% 줄였다고 밝혔다.

AI
오픈소스
읽기
2026년 5월 29일

Linux Foundation launches DNS-AID — agent discovery 경쟁이 중앙 레지스트리에서 DNS 기반 개방 표준으로 이동

Linux Foundation은 2026년 5월 27일 DNS-AID 프로젝트를 공개했다. 이 프로젝트는 DNS 인프라를 활용해 AI agents와 MCP servers를 publish, discover, verify할 수 있게 하는 오픈소스 reference implementation으로, Python SDK·CLI·MCP server를 함께 제공한다.

AI
에이전트
읽기
2026년 5월 28일

Warp is now open-source — agentic development 도구 경쟁이 폐쇄형 제품에서 공개형 orchestrated workflow로 이동

Warp는 2026년 4월 28일 Warp client를 AGPL로 오픈소스화하고, 커뮤니티가 Oz 기반 agent-first workflow로 제품 개발에 참여할 수 있다고 발표했다. 동시에 Kimi·MiniMax·Qwen 같은 오픈 모델 지원, auto (open) model routing, 설정 파일 공개도 함께 내놨다.

AI
개발도구
읽기
2026년 5월 25일

PyTorch 2.12 Release — 모델 프레임워크 경쟁이 연구 편의성에서 하드웨어 중립 배포와 추론 효율로 이동

PyTorch Foundation은 2026년 5월 13일 PyTorch 2.12를 공개했다. 이번 릴리스는 CUDA에서 batched linalg.eigh 최대 100배 가속, torch.accelerator.Graph를 통한 CUDA/XPU 공통 graph capture API, torch.export의 Microscaling quantization 포맷 지원, torch.cond의…

AI
개발도구
읽기
2026년 5월 24일

Red Hat Launches New Developer Tools for Agentic AI — 로컬 샌드박스와 공급망 검증이 agent 개발 기본 스택으로 들어온다

Red Hat은 2026년 5월 12일 Red Hat Desktop GA, isolated AI agent sandboxing, 그리고 Red Hat Advanced Developer Suite 확장을 발표했다. 핵심은 로컬 Podman 기반 개발 환경, OpenShift Dev Spaces, trusted software factory, SLSA Level 3 기반 Trusted…

AI
개발도구
읽기
2026년 5월 21일

Introducing AMS — 오픈웨이트 LLM 검증이 프롬프트 테스트에서 구조적 안전성 스캔으로 이동

Google은 2026년 4월 27일 AMS(Activation-based Model Scanner)를 오픈소스로 공개했다. 이 도구는 프롬프트를 실제로 생성하지 않고도 10~40초 안에 open-weight LLM의 safety-relevant activation structure를 검사해, instruction-tuned 모델과 uncensored 또는 변조된 모델을 구분하도록 설계됐다.

AI
오픈소스
읽기
2026년 5월 21일

Introducing STATE-Bench — 에이전트 메모리 경쟁이 retrieval 정확도에서 작업 신뢰성 검증으로 이동

Microsoft는 2026년 5월 19일 STATE-Bench를 공개했다. 이는 AI agent memory를 단순 retrieval 문제가 아니라 실제 task completion, pass^5 reliability, token efficiency 관점에서 측정하는 오픈 benchmark다.

AI
에이전트
읽기
2026년 5월 20일

Introducing RAMPART and Clarity — agent 안전이 보안 리뷰에서 CI와 설계 산출물로 이동

Microsoft는 2026년 5월 20일 RAMPART와 Clarity를 오픈소스로 공개했다. RAMPART는 adversarial 및 benign 시나리오를 pytest 기반 반복 테스트로 작성해 CI에 넣는 agent safety 테스트 프레임워크이고, Clarity는 문제 정의·실패 분석·의사결정을 .clarity-protocol/ Markdown 산출물로 남기는 structured…

AI
개발도구
읽기
2026년 5월 20일

NVIDIA-Verified Agent Skills Provide Capability Governance for AI Agents — agent 확장성 경쟁이 capability supply chain 검증으로 이동

NVIDIA는 2026년 5월 19일 agent skill에 transparency, security scanning, cryptographic signing, machine-readable skill card를 부여하는 NVIDIA-Verified Skills 체계를 공개했다. 검증된 skill은 cataloging, review, SkillSpector 스캔, signing,…

AI
에이전트
읽기
2026년 5월 18일

Hermes Unlocks Self-Improving AI Agents, Powered by NVIDIA RTX PCs and DGX Spark — 로컬 에이전트 경쟁이 모델보다 orchestration 설계로 이동

NVIDIA는 2026년 5월 13일 Nous Research의 오픈소스 Hermes Agent를 소개하며, 이 프레임워크가 3개월도 안 돼 GitHub star 14만 개를 넘겼고 OpenRouter 기준 가장 많이 쓰이는 agent라고 설명했다. Hermes는 self-evolving skills, contained sub-agents, curated reliability를 내세우며…

AI
오픈소스
읽기
2026년 5월 17일

Local open models on laptops — 오픈모델 성능 향상이 하드웨어보다 아키텍처 혁신에 더 크게 의존하기 시작

Hugging Face 커뮤니티 글은 2026년 5월 11일, 128GB MacBook Pro 기준 로컬에서 구동 가능한 최상위 오픈웨이트 모델의 성능이 2년 사이 Artificial Analysis Intelligence Index 10 → 47로 상승했다고 정리했다. 같은 기간 RAM 상한은 128GB로 거의 고정됐고, 향상의 핵심 동인은 sparse MoE, mixed…

AI
오픈소스
읽기
2026년 5월 14일

Conductor — multi-agent orchestration이 LLM 라우팅에서 deterministic YAML workflow로 이동

Microsoft는 2026년 5월 14일 오픈소스 CLI Conductor를 공개했다. MIT 라이선스 기반으로 multi-agent workflow를 YAML로 선언하고, 에이전트 간 라우팅을 LLM이 아니라 deterministic graph로 실행하며, 조건 분기는 Jinja2 템플릿과 expression evaluation으로 처리해 orchestration layer 자체의 토큰…

AI
에이전트
읽기
2026년 5월 12일

DeepSeek-V4 — open frontier model 경쟁이 context length 표기보다 agent runtime 효율로 이동

DeepSeek-V4는 2026년 4월 24일 공개된 open MoE 계열로, DeepSeek-V4-Pro는 총 1.6T 파라미터 중 49B 활성, Flash는 284B 중 13B 활성 구조를 쓴다. 두 모델 모두 1M-token context를 지원하고, V4-Pro는 1M 토큰에서 V3.2 대비 single-token inference FLOPs를 27% 수준으로 낮추고 KV cache…

AI
모델
읽기
2026년 5월 12일

vLLM x Mooncake — agent 인프라 병목이 모델 추론보다 distributed KV cache 설계로 이동

vLLM은 2026년 5월 6일 Mooncake Store를 붙인 distributed KV cache pool 설계를 공개했다. Codex 기반 SWE-bench Pro trace 610개를 분석한 결과 agent session은 median 33 turns, 평균 input-to-output ratio 131:1, context가 trace당 12K에서 80K 토큰으로 커졌고, 이…

AI
에이전트
읽기
2026년 5월 11일

EMO — MoE가 실제 배포 가능한 모듈형 모델로 진화할 수 있음을 보여준 AllenAI의 오픈 릴리즈

AllenAI는 2026년 5월 8일 EMO를 공개했다. 이 모델은 1B active / 14B total parameter, 128 experts, 1T tokens 규모의 MoE를 문서 단위 shared expert pool 제약으로 학습해, 전체 expert의 12.5%만 사용해도 near full-model 성능을 유지하도록 설계됐다.

AI
모델
읽기
2026년 5월 9일

NVIDIA and ServiceNow Partner on New Autonomous AI Agents for Enterprises — desktop agent 경쟁이 모델 성능에서 governed runtime으로 이동

NVIDIA와 ServiceNow는 2026년 5월 5일 기업용 자율 에이전트 협업을 확대한다고 발표했다. ServiceNow는 로컬 파일시스템·터미널·설치 앱에 접근할 수 있는 장기 실행형 desktop agent Project Arc를 공개했고, 이 에이전트는 NVIDIA OpenShell이라는 오픈소스 sandboxed runtime과 ServiceNow AI Control…

AI
에이전트
읽기
2026년 5월 7일

Browser Harness - LLM 기반 자가치유 브라우저 자동화 프레임워크

Browser Harness는 LLM이 Chrome DevTools Protocol(CDP)을 통해 브라우저 작업을 직접 수행하되, 필요한 헬퍼 코드를 실행 중 스스로 생성하는 자가치유(self-healing) 자동화 프레임워크다. 핵심 코드가 ~1,000줄에 불과한 초경량 구조.

AI
오픈소스
읽기
2026년 5월 5일

Accelerating Gemma 4: faster inference with multi-token prediction drafters — 오픈모델 경쟁의 기준이 benchmark보다 latency economics로 이동

Google은 2026년 5월 5일 Gemma 4용 Multi-Token Prediction (MTP) drafters를 공개했다. 이 speculative decoding 구조는 Gemma 4 target model과 경량 drafter를 결합해 output 품질 저하 없이 최대 3배 속도 향상을 제공하며, Gemma 4는 출시 수주 만에 6천만 다운로드를 넘겼다고 밝혔다.

AI
오픈소스
읽기
2026년 5월 2일

NVIDIA Nemotron 3 Nano Omni — multimodal agent 스택이 모델 조합에서 단일 perception sub-agent로 수렴

NVIDIA는 2026년 4월 28일 vision·audio·video·text를 한 모델에서 처리하는 오픈 multimodal reasoning model Nemotron 3 Nano Omni를 발표했다. 이 모델은 30B-A3B hybrid MoE, 256K context를 기반으로 document intelligence·video/audio understanding…

AI
오픈소스
읽기
2026년 5월 1일

Warp is now open-source — ADE 경쟁이 제품 기능에서 오픈 에이전트 운영체제로 확장

Warp는 2026년 4월 28일 Warp client를 AGPL로 오픈소스화하고, Oz 기반 agent-first 기여 워크플로를 공개했다. 동시에 Kimi·MiniMax·Qwen 지원 확대, auto (open) 모델 라우팅, 설정 파일 추가로 IDE/ADE를 더 개방형 표면으로 재구성했다.

AI
오픈소스
읽기
2026년 4월 30일

Qwen3.6 — 오픈 코딩 모델 경쟁이 벤치마크보다 저장된 추론과 레포 단위 작업 완성도로 이동

Qwen 팀은 2026년 4월 Qwen3.6 시리즈를 공개하며 35B-A3B와 27B 모델을 순차 배포했다. 공식 저장소 기준으로 이번 릴리스는 agentic coding, front-end workflow, repository-level reasoning 강화와 함께 conversation history 전반에 thinking context를 유지하는 Thinking…

AI
모델
읽기
2026년 4월 26일

Nemotron-Personas-Korea — 한국 실제 분포 기반 합성 페르소나 데이터셋

NVIDIA가 공개한 한국어 합성 페르소나 데이터셋으로, 한국의 공개 통계와 지역·직업·교육 등 사회적 분포를 바탕으로 100만 개 규모의 페르소나 레코드를 구성한 자료다. 한국어 모델 학습과 시뮬레이션에서 한국형 맥락을 반영하는 데 참고할 수 있다. 소버린 AI, 한국어 LLM 학습, 합성 데이터 다양성 확대 관점에서 볼 만하다. 영어권 중심 페르소나 데이터셋으로는 놓치기 쉬운 지역성과…

AI
모델
읽기
2026년 4월 25일

Mistral 3 — 오픈 모델 경쟁이 단일 플래그십에서 full-stack open portfolio 전략으로 이동

Mistral AI는 최근 Mistral 3를 공개하며 675B total / 41B active의 Mistral Large 3와 3B·8B·14B 규모의 Ministral 3 시리즈를 함께 내놨다. 전 모델을 Apache 2.0으로 공개하고, Large 3는 8×A100 또는 8×H100 단일 노드 배포 경로, 소형 모델은 edge·robotics 환경까지 겨냥하며 배포 범위를 넓혔다.

AI
모델
읽기
2026년 4월 21일

Agent Governance Toolkit — 에이전트 보안이 사후 감사에서 runtime kernel 계층으로 이동

Microsoft는 2026년 4월 2일 Agent Governance Toolkit을 MIT 라이선스로 공개했다. 이 오픈소스 프로젝트는 OWASP Agentic AI Top 10의 10개 위험군을 모두 다루는 runtime governance stack을 목표로 하며, Agent OS·Mesh·Runtime·SRE·Compliance·Marketplace·Lightning의 7개…

AI
트렌드
읽기
2026년 4월 20일

Voicebox — 로컬에서 음성 복제·TTS를 다루는 오픈소스 보이스 스튜디오

Voicebox는 음성 복제, 다국어 TTS, 후처리 효과, 멀티 보이스 편집을 한곳에서 다루는 로컬 우선 음성 합성 스튜디오다. 클라우드형 음성 서비스의 대안으로 제시되며, 여러 TTS 엔진을 바꿔가며 테스트하고 REST API로 앱에 붙일 수 있게 설계됐다. 볼 만한 이유는 단순한 모델 데모가 아니라 실제 제작 워크플로우에 가까운 구조를 갖췄기 때문이다. 몇 초짜리 샘플로 보이스…

오픈소스
무료
읽기
2026년 4월 17일

Mistral Small 4 공개 — 오픈 모델 전략이 단일 체크포인트에서 다기능 통합형 reasoning stack으로 이동

Mistral은 2026년 4월 16일 Mistral Small 4를 발표했다. 이 모델은 119B total parameters, 6B active parameters의 128-expert MoE 구조와 256k context window를 갖고, reasoning·multimodal·agentic coding을 하나로 묶은 Apache 2.0 오픈 모델로 제공된다.

AI
트렌드
읽기
2026년 4월 15일

Hugging Face State of Open Source Spring 2026 — 오픈 모델 경쟁의 축이 성능에서 주권·배포·파생 생태계로 이동

Hugging Face는 2026년 봄 오픈소스 AI 리포트를 통해 2025년 신규 trending model의 다수가 China에서 개발되었거나 China-origin 모델 파생형이었고, Alibaba의 Qwen 계열은 11만 3천 개 이상의 derivative models를 만들었다고 정리했다. 또 1-9B급 모델의 상위군은 100B+ 모델 대비 median 기준 약 4배 높은…

AI
트렌드
읽기
2026년 4월 15일

Graphify — 코드·문서·영상을 쿼리 가능한 지식 그래프로 변환하는 AI 도구

코드(25개 언어), 문서, 논문, 이미지, 비디오 등 다양한 파일을 분석해 쿼리 가능한 지식 그래프로 변환하는 AI 어시스턴트 스킬. Tree-sitter AST로 코드 구조를 추출하고, Claude Vision으로 이미지를 분석하며, faster-whisper로 영상/오디오를 로컬 변환한다. 원본 대비 71.5배 토큰 감소. GitHub 스타 26.6k.

트렌드
오픈소스
읽기
2026년 4월 14일

Open Agents — Vercel용 백그라운드 코딩 에이전트 레퍼런스 앱

Open Agents는 Vercel 위에서 백그라운드 코딩 에이전트를 만들고 실행하기 위한 오픈소스 레퍼런스 앱이다. 웹 UI, 에이전트 런타임, 샌드박스 오케스트레이션, GitHub 연동까지 함께 제공해 프롬프트에서 실제 코드 변경과 저장소 작업으로 이어지는 흐름을 한 저장소 안에서 보여준다. 이 링크가 볼 만한 이유는 에이전트와 샌드박스를 분리한 구조를 비교적 선명하게 드러내기…

AI
오픈소스
읽기
2026년 4월 14일

colleague.skill - 동료 페르소나 기반 스킬 생성기

colleague.skill은 특정 동료의 업무 방식과 표현 톤을 스킬 형태로 정리해 재사용할 수 있게 만드는 오픈소스 프로젝트다. /create-colleague 명령으로 새 스킬을 만들고, 생성된 페르소나를 /{slug} 형태로 호출해 반복 작업에 적용한다. 프롬프트를 매번 복붙하는 대신, 팀 내부의 암묵지와 일 스타일을 에이전트가 읽는 재사용 가능한 인터페이스로 바꾸려는 시도이기…

AI
오픈소스
읽기
2026년 4월 14일

CC 베스트 프랙티스 모음

AI 코딩 도구 운영 팁 저장소

AI
오픈소스
읽기
2026년 4월 14일

TypeUI - AI 에이전트용 디자인 레이어 CLI

TypeUI는 AI가 생성한 UI 코드 위에 일관된 시각 규칙을 덧입히기 위한 CLI이자 디자인 스킬 레지스트리다. pull·generate·update 흐름으로 스킬을 프로젝트에 주입하고, 무료 스킬과 상용 기능을 함께 제공한다. AI 코딩의 문제를 단순히 더 많이 생성하는 것이 아니라, 여러 에이전트와 작업자가 섞여도 같은 시각 언어를 유지하게 만드는 데 초점을 둔 도구라는 점이…

AI
오픈소스
읽기
2026년 4월 13일

Anthropic downgraded cache TTL on March 6th

캐시 TTL은 2026년 3월 초경에 1시간에서 5분으로 자동 회귀하여 상당한 할당량과 비용 인플레이션을 일으킨 것으로 보입니다. 1월에 걸쳐 원시 Claude 코드 세션 JSONL 파일에 대한 요약 분석...

트렌드
AI
읽기
2026년 4월 13일

Pro Max 5x quota exhausted in 1.5 hours despite moderate usage

실행 전 체크리스트 기존 문제를 검색했지만 아직 보고되지 않았습니다. 이것은 단일 버그 보고서입니다(다른 버그에 대해서는 별도의 보고서를 제출해 주십시오). 최신 버전의 ...을 사용하고 있습니다.

트렌드
AI
읽기
2026년 4월 12일

Mistral 3 공개 — 오픈 멀티모달 모델 경쟁이 frontier급과 edge급 이중 전선으로 재편되다

Mistral AI는 2026년 4월 초 Mistral 3를 공개했다. 라인업은 14B·8B·3B의 소형 dense 모델과 41B active/675B total parameters의 Mistral Large 3로 구성되며, 전 모델을 Apache 2.0 라이선스로 공개했고 Large 3는 LMArena 기준 오픈 비추론 모델 2위라고 밝혔다.

AI
트렌드
읽기
2026년 4월 8일

Show HN: I built a tiny LLM to demystify how language models work

작은 물고기처럼 말하는 ~9M 매개변수 LLM입니다. GitHub에 계정을 만들어 arman-bd/guppylm 개발에 기여하세요.

트렌드
AI
읽기
2026년 4월 8일

awesome-design-md — AI 에이전트를 위한 디자인 시스템 컬렉션

Google Stitch의 DESIGN 문서 개념을 바탕으로, 유명 서비스의 시각 언어를 Markdown으로 정리해 AI 코딩 에이전트가 유사한 UI를 구현하도록 돕는 오픈소스 컬렉션. 공식 디자인 시스템이 아니라 공개 웹사이트를 바탕으로 추출한 비공식 레퍼런스라는 점이 핵심이다.

AI
오픈소스
읽기
2026년 4월 7일

Issue: Claude Code is unusable for complex engineering tasks with Feb updates

실행 전 체크리스트 비슷한 행동 보고서를 찾기 위해 기존 문제를 검색했습니다. 이 보고서에는 민감한 정보(API 키, 비밀번호 등)가 포함되어 있지 않습니다. 행동 유형 문제 기타 예상치 못한...

트렌드
AI
읽기
2026년 4월 6일

Hugging Face State of Open Source Spring 2026 — 오픈 모델 경쟁의 무게중심이 미국 중심에서 다극·주권형 생태계로 이동

Hugging Face가 2026년 3월 17일 공개한 Spring 2026 리포트에 따르면, 플랫폼은 1,300만 사용자·200만 개 이상의 공개 모델·50만 개 이상의 공개 데이터셋으로 커졌고, 중국 모델이 전체 다운로드의 41%를 차지하며 미국을 추월했다. 동시에 Qwen 계열 파생 모델은 11.3만 개를 넘었고, 1~9B급 소형 모델이 실제 배포에서 대형 모델보다 훨씬 높은 채택을…

AI
트렌드
읽기
2026년 4월 6일

AirLLM — 4GB GPU에서 70B LLM 돌리는 초경량 추론 라이브러리

양자화나 증류 없이 70B 모델을 4GB GPU에서, Llama 3.1 405B를 8GB VRAM에서 실행할 수 있는 추론 최적화 라이브러리. 계층별 모델 분해(layer-wise decomposition)로 필요한 레이어만 메모리에 로드하는 방식. 블록 단위 양자화 압축으로 3배 속도 향상. GitHub 스타 15k+.

오픈소스
무료
읽기
2026년 4월 5일

Claw Code, Claude Code 소스 유출 계기로 등장한 오픈소스 AI 코딩 에이전트 — 출시 1주일 만에 GitHub 100K stars

3월 31일 Anthropic Claude Code의 TypeScript 소스코드 약 51만 2천 줄이 npm 레지스트리에 실수로 노출된 사건을 계기로, 개발자 Sigrid Jin이 클린룸 방식으로 오픈소스 AI 코딩 에이전트 프레임워크 Claw Code를 출시했다. 출시 첫날 72,000 GitHub stars를 기록하고 일주일 만에 100K를 돌파하며 역사상 가장 빠르게 성장한 AI…

트렌드
오픈소스
읽기
2026년 4월 5일

Google Gemma 4 공개 — Apache 2.0·256K 컨텍스트·멀티모달, 오픈 에이전틱 모델의 새 기준

Google이 4월 2~3일 Gemma 4를 Apache 2.0 라이선스로 공개했다. Effective 2B·4B·26B MoE·31B Dense 네 가지 크기로 제공되며, 256K 토큰 컨텍스트, 비전·오디오 네이티브 멀티모달, 140개 이상 언어를 지원한다.

트렌드
오픈소스
읽기
2026년 4월 5일

PrismML, Bonsai 1-bit LLM 출시 — 1GB 메모리로 8B 추론, 엣지 AI의 현실화

PrismML이 4월 3일 스텔스에서 등장해 세계 최초 상업적으로 실행 가능한 1-bit LLM 패밀리 Bonsai를 Apache 2.0으로 공개했다. 플래그십인 Bonsai 8B는 1.15GB 메모리에 구동되며, FP16 8B 모델 대비 14배 소형·8배 빠른 속도·5배 낮은 에너지 소비를 달성하면서 추론 품질은 동급 수준을 유지한다.

트렌드
오픈소스
읽기
2026년 4월 5일

Google TurboQuant — KV Cache 6배 압축·H100 어텐션 8배 가속, 정확도 손실 제로로 LLM 서빙 비용 구조 재정의

Google Research가 공개한 TurboQuant는 LLM의 KV Cache를 3비트로 압축하는 학습 불필요(training-free) 벡터 양자화 알고리즘이다. 메모리 사용량 6배 감소, NVIDIA H100 어텐션 연산 8배 가속을 정확도 손실 없이 달성하며 ICLR 2026에 발표된다.

트렌드
AI
읽기
2026년 4월 5일

Agency Swarm — 조직형 멀티에이전트 오케스트레이션 프레임워크

OpenAI Agents SDK 위에 올려진 멀티에이전트 프레임워크. 역할별 에이전트와 communication flow를 명시적으로 정의해 조직처럼 협업시키는 데 초점이 있다.

AI
오픈소스
읽기
2026년 4월 5일

Agno — 프레임워크·런타임·컨트롤 플레인을 묶은 에이전트 스택

multi-agent 시스템을 구축·실행·관리하는 전체 스택. framework, AgentOS runtime, control plane을 함께 제공해 프로덕션 지향성이 강하다.

AI
오픈소스
읽기
2026년 4월 5일

AutoGen — Microsoft의 멀티에이전트 프로그래밍 프레임워크

Microsoft가 만드는 agentic AI 프레임워크. 여러 에이전트가 자율적으로 또는 인간과 함께 협업하는 구조를 코드로 만들 수 있다.

AI
오픈소스
읽기
2026년 4월 5일

AutoGPT — 지속 실행형 AI 에이전트 플랫폼

지속 실행형 AI 에이전트를 만들고 배포하는 대표 오픈소스 프로젝트. 단일 데모 에이전트가 아니라 플랫폼·서버·마켓플레이스·벤치마크까지 묶인 생태계로 확장됐다.

AI
오픈소스
읽기
2026년 4월 5일

browser-use — 웹사이트를 AI 에이전트용 인터페이스로 바꾸는 브라우저 자동화

웹사이트를 AI 에이전트가 조작할 수 있게 해주는 브라우저 자동화 오픈소스. 사람이 브라우저로 하던 클릭·입력·탐색을 agent workflow에 연결하는 데 강하다.

AI
오픈소스
읽기
2026년 4월 5일

CrewAI — 역할 기반 멀티에이전트 협업 프레임워크

각 agent에 역할을 부여하고 crew 단위로 협업시키는 Python 프레임워크. LangChain에 의존하지 않는 독립 구조와 비교적 쉬운 진입점으로 인기가 높다.

AI
오픈소스
읽기
2026년 4월 5일

Dify — 워크플로·RAG·에이전트를 묶은 프로덕션 플랫폼

시각적 워크플로, RAG, agent 기능, observability를 한데 묶은 오픈소스 플랫폼. 빠르게 프로토타입을 만들고 운영 환경으로 가져가는 데 강하다.

AI
오픈소스
읽기
2026년 4월 5일

LangGraph — 상태를 가진 에이전트를 그래프로 설계하는 프레임워크

장기 실행·상태 유지·human-in-the-loop를 강조하는 low-level orchestration 프레임워크. agent를 노드와 엣지 그래프로 설계해 복잡한 흐름을 다루기 좋다.

AI
오픈소스
읽기
2026년 4월 5일

Model Context Protocol Servers — MCP 레퍼런스 서버 모음

MCP의 공식 레퍼런스 서버 모음. filesystem, fetch, git, memory 같은 예시 서버를 통해 LLM/에이전트가 외부 도구와 안전하게 연결되는 방식을 보여준다.

AI
오픈소스
읽기
2026년 4월 5일

Semantic Kernel — 엔터프라이즈 지향 에이전트 오케스트레이션 SDK

Microsoft의 모델 중립 SDK. agent, multi-agent workflow, plugin, MCP, vector DB를 함께 다루며 .NET/Python/Java를 지원한다.

AI
오픈소스
읽기
2026년 4월 5일

CLI-Anything — 기존 소프트웨어를 에이전트용 CLI로 바꾸는 프레임워크

기존 GUI 소프트웨어·리포를 에이전트가 다루기 쉬운 stateful CLI와 SKILL.md로 변환하는 오픈소스 프레임워크. HARNESS.md 기반 7단계 생성·테스트·배포 절차를 제공한다.

AI
오픈소스
읽기
2026년 4월 4일

Meta BOxCrete 공개 — 데이터센터 콘크리트 배합을 AI로 최적화, 강도 도달 43% 단축

Meta는 2026년 3월 30일 BOxCrete를 공개하며 데이터센터용 콘크리트 배합 최적화에 AI를 적용한 사례를 발표했다. Meta에 따르면 Rosemount 데이터센터 현장에서는 AI가 제안한 배합이 기존 공식보다 full structural strength 도달 시간을 43% 줄였고 cracking risk도 약 10% 낮췄다.

트렌드
오픈소스
읽기
2026년 4월 3일

Arcee Trinity-Large-Thinking 출시 — 미국계 오픈 에이전트 모델이 가격 대비 frontier 경쟁력 제시

Arcee AI가 2026년 4월 1일 Trinity-Large-Thinking을 공개했다. Apache 2.0 오픈웨이트 reasoning 모델로, long-horizon agent와 multi-turn tool calling에 초점을 맞췄고 PinchBench에서 Opus 4.6 바로 아래 2위를 기록했다고 밝혔다.

AI
모델
읽기
2026년 4월 3일

Gemma 4 공개 — Apache 2.0 오픈 모델을 agentic workflow 중심으로 재정의

Google DeepMind가 2026년 4월 2일 Gemma 4를 공개했다. E2B, E4B, 26B MoE, 31B Dense 네 가지 크기로 출시됐고, Apache 2.0 라이선스 아래 reasoning, function calling, JSON output, vision/audio 입력까지 지원한다.

AI
모델
읽기
2026년 4월 2일

vLLM Model Runner V2 출시 — Prefill-Decode 분리 스케줄링으로 오픈소스 LLM 추론 아키텍처 혁신

2026년 3월, vLLM 프로젝트가 Model Runner V2(MRV2)를 릴리즈했다. 기존 스케줄러 아키텍처를 전면 재설계하여 Prefill-Decode 완전 분리 스케줄링과 Zero-Copy DMA 전송을 도입했다. HuggingFace 대비 24배 처리량을 유지하며 GitHub 스타 74,900개로 프로덕션 LLM 추론 엔진의 사실상 표준 위치를 공고히 했다.

AI
오픈소스
읽기
2026년 4월 2일

PrismML Bonsai — 세계 최초 상용 가능 1-bit LLM, iPhone에서 44 tok/s 달성

PrismML이 2026년 3월 31일 세계 최초로 상용 수준 1-bit LLM 'Bonsai' 시리즈를 공개했다. 8B·4B·1.7B 세 가지 모델을 Apache 2.0 라이센스로 무료 배포하며, 기존 FP16 대비 메모리를 14배 절감하고 추론 속도를 8배 높이면서도 동급 모델과 동일한 벤치마크 성능을 유지한다.

AI
오픈소스
읽기
2026년 4월 2일

Claw Code — Claude Code 소스 기반 Python/Rust 클린룸 재구현 프로젝트 (130k★)

Claude Code 소스 공개를 계기로 탄생한 클린룸 재구현 프로젝트. Python + Rust로 에이전트 하네스 아키텍처를 재구현했다. 출시 2시간 만에 50k 스타, 현재 130k 스타 / 102k 포크. Sigrid Jin이 발기인.

트렌드
오픈소스
읽기
2026년 4월 1일

NVIDIA Nemotron 3 Super — 120B MoE 오픈소스 에이전트 모델, SWE-Bench 60.5% 달성

NVIDIA가 에이전트 워크로드 특화 오픈소스 모델 Nemotron 3 Super를 공개했다. Mamba-Transformer 하이브리드 MoE 아키텍처로 원래 1,200억 파라미터에서 활성 파라미터 120억만 사용, SWE-Bench Verified 60.47% 및 PinchBench 85.6%로 동급 오픈소스 최고 성능을 기록했다.

트렌드
오픈소스
읽기
2026년 4월 1일

Google TurboQuant, LLM KV 캐시 메모리 6배 압축·H100 속도 8배 향상 달성

Google Research가 ICLR 2026에서 발표할 TurboQuant를 공개했다. 별도 학습 없이 LLM의 KV 캐시를 3비트로 압축해 메모리를 6배 절감하고, NVIDIA H100에서 어텐션 연산 속도를 최대 8배 높이면서도 정확도 손실이 없다.

AI
트렌드
읽기
2026년 4월 1일

OpenAI, 최초 오픈웨이트 모델 gpt-oss-120b 공개 — Apache 2.0, o4-mini 수준 추론 성능

OpenAI가 처음으로 오픈웨이트 모델인 gpt-oss-120b(117B 파라미터, MoE)와 gpt-oss-20b를 Apache 2.0 라이선스로 공개했다. 단일 80GB GPU에서 실행 가능하며, 코딩·수학·툴 사용에서 o4-mini와 동등하거나 일부 초과한다.

AI
오픈소스
읽기
2026년 4월 1일

gstack — Garry Tan(YC 회장)이 만든 AI 소프트웨어 팩토리

Y Combinator 회장 Garry Tan이 만든 Claude Code 기반 AI 소프트웨어 팩토리. 23개의 전문화된 AI 역할(경영진, 엔지니어링, 디자인, QA, 보안 등)을 조합해 10~15개 스프린트를 병렬로 돌린다. 60일간 60만 줄 프로덕션 코드 산출, 일일 1~2만 줄 생산량. GitHub 스타 60.1k.

트렌드
오픈소스
읽기
2026년 4월 1일

Paperclip — AI 에이전트 팀을 회사처럼 운영하는 오케스트레이션 플랫폼

여러 AI 에이전트를 하나의 회사 조직처럼 구성하고 운영하는 오픈소스 오케스트레이션 플랫폼. 조직도, 목표 정렬, 예산 관리, 거버넌스(승인 게이트, 롤백, 감사 로그)까지 갖추고 있다. "OpenClaw이 직원이라면 Paperclip은 회사다." GitHub 스타 42.8k.

트렌드
오픈소스
읽기
2026년 3월 31일

Google TurboQuant — KV 캐시를 3비트로 6배 압축, 재학습 없이 H100에서 8배 처리량

Google의 TurboQuant가 ICLR 2026에서 발표될 예정이다. LLM의 KV 캐시를 3~4비트로 압축해 메모리를 4~6배 절감하면서 정확도 손실이 전혀 없고, H100 GPU에서 32-bit 대비 최대 8배 처리량 향상을 달성한다.

AI
모델
읽기
2026년 3월 31일

Mistral Voxtral TTS — 4B 오픈소스 음성 합성 모델, ElevenLabs 대비 7~9배 저렴

Mistral AI가 3월 26일 오픈소스 텍스트-음성 변환 모델 Voxtral TTS(4B 파라미터)를 출시했다. 9개 언어를 지원하고 5초 이하의 음성 샘플로 목소리를 복제하며, 첫 오디오 출력 지연(TTFA)이 90ms에 불과해 실시간 음성 에이전트 구현이 가능하다.

AI
모델
읽기
2026년 3월 31일

NVIDIA Nemotron 3 Super — 120B Mamba-Transformer MoE 오픈 에이전트 모델, 이전 대비 5배 처리량

NVIDIA가 에이전트 AI 특화 오픈 모델 Nemotron 3 패밀리를 출시했다. 플래그십인 Nemotron 3 Super는 120B 파라미터(활성 12B)의 Mamba-Transformer MoE 하이브리드 아키텍처를 채택해 Nemotron 2 대비 5배 처리량을 달성하고 1M 토큰 컨텍스트 윈도우를 지원한다.

AI
모델
읽기
2026년 3월 31일

Google TurboQuant — LLM KV 캐시 3.5비트 압쳙으로 메모리 6배 절감, 오픈소스 공개

Google이 LLM의 KV-캐시를 채널당 3.5비트로 압쳙하는 오픈소스 양자화 기법 TurboQuant를 공개했다. 메모리 사용량을 최대 6배 줄이고 추론 속도를 대폭 향상시킨다.

AI
모델
읽기
2026년 3월 30일

Alibaba Qwen 3.5 소형 모델 공개 — 9B 파라미터로 GPT-OSS-120B 능가, Apache 2.0 오픈소스

Alibaba가 0.8B, 2B, 4B, 9B 파라미터 4종의 Qwen 3.5 소형 모델을 Apache 2.0 라이선스로 공개했다. 9B 모델이 GPQA Diamond 벤치마크에서 81.7점을 기록해 GPT-OSS-120B(71.5점)를 13.6% 앞질렀다.

AI
모델
읽기
2026년 3월 30일

Google TurboQuant, LLM KV 캐시 메모리 6배 절감 — 3-bit 양자화로 H100에서 8배 속도 향상

Google Research가 공개한 TurboQuant는 3-bit 벡터 양자화 기법을 통해 LLM의 KV 캐시 메모리를 6배 줄이면서 H100 GPU에서 최대 8배 추론 속도 향상을 달성했다. 정확도 손실 없이 이를 구현한 점이 핵심이다.

AI
모델
읽기
2026년 3월 30일

Mistral Small 4 (22B), 오픈소스 추론 벤치마크 1위 — 자기 3~5배 규모 클로즈드 모델 추월

프랑스 Mistral AI가 공개한 22B 파라미터의 Mistral Small 4가 추론 및 지시 수행 벤치마크에서 자신보다 3~5배 큰 클로즈드 모델들을 앞질렀다. Apache 2.0 라이선스로 제공되며 상업적 이용도 자유롭다.

AI
모델
읽기
2026년 3월 30일

Google TurboQuant, LLM KV 캐시 6배 압축 — 재학습 없이 H100에서 8배 처리량 향상

Google Research가 ICLR 2026에서 발표한 TurboQuant는 LLM 추론의 가장 큰 메모리 병목인 KV 캐시를 3~4비트로 압축해 메모리 사용량을 최대 6배 절감하는 알고리즘으로, 재학습이나 파인튜닝 없이 적용 가능하며 품질 손실이 사실상 없다.

AI
모델
읽기
2026년 3월 30일

Mistral Small 4, 119B MoE 모델 Apache 2.0 오픈소스 출시 — GPT-OSS 120B 능가하며 추론 효율도 앞서

Mistral AI가 3월 중순 출시한 Mistral Small 4는 119B 파라미터 Mixture-of-Experts(MoE) 구조의 오픈소스 모델로, Apache 2.0 라이선스 하에 상업적 무제한 사용이 가능하며 토큰당 활성 파라미터는 6B에 불과해 추론 속도가 매우 빠르다.

AI
오픈소스
읽기
2026년 3월 30일

Pretext — DOM 없이 텍스트 측정하는 순수 JS 레이아웃 라이브러리

chenglou(React 초기 멤버, ReasonML 창시자)가 만든 다국어 텍스트 측정 및 레이아웃 라이브러리. DOM의 getBoundingClientRect 같은 비싼 측정을 완전히 우회하고, 순수 산술 계산만으로 텍스트 높이와 라인 레이아웃을 처리한다. GitHub 스타 13.9k.

오픈소스
무료
읽기
2026년 3월 30일

MCP, 월 9700만 다운로드 돌파 — 16개월 만에 React 수준 생태계, AI 에이전트 필수 인프라로 공식화

Model Context Protocol(MCP) SDK의 월간 다운로드가 2026년 3월 기준 9700만 건을 돌파했다. 2024년 11월 Anthropic이 출시했을 당시 약 200만 건이었던 수치가 16개월 만에 4,750% 성장한 것으로, React npm 패키지가 1억 다운로드에 도달하는 데 걸린 3년 대비 절반의 시간이다.

AI
트렌드
읽기
2026년 3월 30일

Mistral Small 4 출시 — 119B MoE (활성 6.5B), Apache 2.0, 추론·멀티모달·코딩 단일 모델 통합

Mistral AI가 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 총 119B 파라미터의 MoE 아키텍처로 활성 파라미터는 6.5B에 불과하지만, 기존에 별도 모델로 운용하던 Magistral(추론), Pixtral(멀티모달), Devstral(에이전트 코딩) 세 가지 역량을 256K 컨텍스트 창 하나로 통합했다.

AI
오픈소스
읽기
2026년 3월 29일

Alibaba Qwen 3.5 Small 시리즈 출시: 9B 모델이 GPT 120B를 벤치마크에서 앞질러

Alibaba가 Qwen 3.5 Small 시리즈(0.8B·2B·4B·9B)를 Apache 2.0 라이선스로 오픈소스 공개했다. 9B 모델의 GPQA 점수 81.7로 OpenAI의 GPT-OSS-120B(71.5)를 벤치마크에서 앞질렀다.

AI
오픈소스
읽기
2026년 3월 29일

Google TurboQuant: KV-cache 6배 압축으로 LLM 메모리 혁신, ICLR 2026 발표

Google이 ICLR 2026에서 TurboQuant를 발표했다. KV-cache를 채널당 3.5비트로 압축해 메모리 사용량을 6배 줄이는 소프트웨어 레벨의 LLM 효율화 기법이다.

AI
트렌드
읽기
2026년 3월 28일

Google TurboQuant: LLM KV-Cache 6배 압축 달성, 메모리 반도체 시장 직격

Google이 ICLR 2026에서 발표한 TurboQuant 양자화 기술은 LLM의 KV-Cache를 채널당 3.5비트로 압축하여 메모리 사용량을 최대 6배 감소시키면서도 모델 품질을 유지("absolute quality neutrality")하는 데 성공했다. 이 결과로 Micron 등 AI 메모리 공급업체 주가가 즉각 하락했다.

AI
모델
읽기
2026년 3월 28일

Mistral Small 4 (22B, Apache 2.0): 자신보다 3~5배 큰 클로즈드 모델 추론 성능 압도

Mistral AI가 220억 파라미터 규모의 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 추론 및 지시 수행 벤치마크에서 파라미터 수가 3~5배 많은 클로즈드 모델 여러 개를 상회하는 성능을 보였다.

AI
모델
읽기
2026년 3월 27일

Mistral Small 4 출시 — 119B MoE, 친지드 추론+비전 통합, Apache 2.0 오픈소스

Mistral AI가 3월 17일 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 119B 파라미터 MoE 구조로 추론 시 약 22B만 활성화되며, 256K 컨텍스트 윈도우와 멀티모달(비전) 기능을 단일 모델에 통합했다. 전작 Small 3 대비 엔드투엔드 완료 시간 40% 단축, 처리량 3배 향상을 달성했다.

오픈소스
무료
읽기
2026년 3월 27일

NVIDIA Nemotron 3 Super 공개 — 120B 하이브리드 MoE 오픈 에이전틱 AI 모델 Apache 2.0

NVIDIA가 GTC 2026에서 120B 전체 파라미터, 12B 활성 파라미터의 하이브리드 Mamba-Transformer MoE 아키텍처 기반 오픈 웨이트 모델 Nemotron 3 Super를 Apache 2.0으로 공개했다. 소프트웨어 개발과 사이버보안 트리아지 등 복잡한 멀티에이전트 태스크를 타겟으로 하며, 10조 토큰 규모의 학습 데이터도 함께 공개됐다.

오픈소스
AI
읽기
2026년 3월 27일

Mistral Small 4 출시 — 119B MoE, 추론·비전·코딩 통합 오픈소스 모델 (Apache 2.0)

Mistral AI가 2026년 3월 16일, 119B 파라미터 Mixture-of-Experts 아키텍처의 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 토큰당 활성 파라미터는 6B으로, 기존 Magistral(추론), Pixtral(비전), Devstral(에이전트 코딩) 세 모델의 기능을 하나로 통합했다.

AI
오픈소스
읽기
2026년 3월 27일

Mistral Voxtral TTS 공개 — 5초 샘플로 음성 복제, 9개 언어 엣지 배포 가능

Mistral AI가 2026년 3월 26일 오픈소스 TTS(텍스트-음성 변환) 모델 Voxtral TTS를 공개했다. Ministral 3B 기반으로 영어·프랑스어·독일어 등 9개 언어를 지원하며, 5초 미만의 음성 샘플로 커스텀 음성 복제가 가능하다. 첫 음성까지 지연(TTFA)은 90ms, 실시간 팩터(RTF)는 6x를 달성했다.

AI
오픈소스
읽기
2026년 3월 26일

Alibaba Qwen 3.5 Small: 9B 모델이 GPT-oss-120B를 GPQA Diamond에서 추월

Alibaba가 0.8B, 2B, 4B, 9B 네 가지 크기의 Qwen 3.5 Small 시리즈를 Apache 2.0 라이선스로 공개했다. 텍스트, 이미지, 비디오를 네이티브 멀티모달로 처리하며, 9B 모델이 GPQA Diamond 벤치마크에서 81.7점을 기록해 GPT-oss-120B(71.5점)를 상회했다.

AI
오픈소스
읽기
2026년 3월 26일

Dapr Agents v1.0 GA: 프로덕션 AI 에이전트의 Kubernetes 클라우드 네이티브 표준

CNCF(Cloud Native Computing Foundation)가 KubeCon + CloudNativeCon Europe 2026(암스테르담)에서 Dapr Agents v1.0 정식 출시를 발표했다. NVIDIA와 오픈소스 커뮤니티가 1년간 협업한 이 Python 프레임워크는 내구성 있는 워크플로우 엔진, 상태 관리, 안전한 멀티 에이전트 조율 기능을 제공한다.

AI
개발도구
읽기
2026년 3월 26일

OpenAI, GPT-oss-120B/20B 오픈 웨이트 모델 Apache 2.0으로 공개

OpenAI가 GPT-oss-120B(MoE, 활성 파라미터 5.1B)와 GPT-oss-20B 두 모델을 Apache 2.0 라이선스로 Hugging Face에 공개했다. GPT-oss-120B는 단일 80GB GPU(H100, MI300X)에서 실행 가능하며, 핵심 추론 벤치마크에서 o4-mini에 근접하는 성능을 기록한다.

AI
오픈소스
읽기
2026년 3월 20일

Autoresearch - Karpathy의 AI 자동 LLM 훈련 실험 프레임워크

AI 에이전트가 자율적으로 LLM 훈련 실험을 수행하는 프레임워크. 5분 단위 훈련 후 성능 평가/반복. 수면 중 ~100회 실험 가능. GitHub 43.9k⭐

트렌드
오픈소스
읽기
2026년 3월 11일

A GitHub Issue Title Compromised 4k Developer Machines

GitHub 문제에 대한 즉각적인 주입으로 연쇄 반응이 발생하여 4,000명의 개발자가 동의 없이 OpenClaw를 설치하게 되었습니다. 이 공격은 잘 알려진 취약점을 새로운 것으로 구성합니다. 하나의 AI 도구가 다른 AI 도구를 부트스트랩합니다.

트렌드
AI
읽기
2026년 2월 26일

MiniMax M2.5 - 오픈소스 AI 모델, Claude Opus 4.6의 1/20 비용

230B 파라미터 MoE 모델(10B 활성). SWE-Bench 80.2%로 Claude Opus 4.6에 근접. 비용은 1/20 수준. 오픈소스(MIT 라이선스).

트렌드
오픈소스
읽기
2026년 2월 10일

Playwright CLI - AI 코딩 에이전트용 브라우저 자동화

Microsoft의 브라우저 자동화 CLI. MCP 대신 CLI 기반으로 토큰 효율성 극대화. Claude Code, Copilot 등 코딩 에이전트에 최적화.

트렌드
오픈소스
읽기
2026년 2월 9일

OpenClaw - 1인 개발자의 초고속 성장 AI 에이전트

1인 개발자 Peter Steinberger가 만든 오픈소스 AI 비서. WhatsApp/Telegram으로 컴퓨터 작업 자동화. GitHub 스타 18만개, 역대 최고속 성장.

트렌드
오픈소스
읽기
2026년 2월 6일

Claude Code Agent Teams - 멀티 에이전트 협업

Claude Code의 새 기능. 여러 에이전트가 병렬로 작업하고 서로 직접 소통하며 협업. 팀 리드가 조율하고 팀원들은 독립적으로 작업.

트렌드
오픈소스
읽기
2026년 2월 3일

claude-mem - Claude Code 영구 메모리

Claude Code를 위한 1줄 설치 메모리 시스템. 세션 간 컨텍스트 손실 방지. AI로 대화 압축 후 ChromaDB에 벡터 저장, 다음 세션에 자동 주입. 로컬 저장으로 프라이버시 보장. GitHub 12k 스타.

트렌드
오픈소스
읽기
2026년 2월 2일

oh-my-ag - 멀티에이전트 개발 스킬

Google Antigravity IDE를 위한 멀티에이전트 스킬. PM/Frontend/Backend/Mobile/QA/Debug 에이전트가 협업. 토큰 75% 절감 설계. Gemini/Claude/Codex/Qwen 등 모델 혼합 사용. 실시간 대시보드. bunx oh-my-ag로 설치.

트렌드
오픈소스
읽기
2026년 1월 29일

AgenticSeek - 100% 로컬 AI 에이전트

Manus AI의 완전 로컬 대안. API 비용 없이 전기세만으로 자율 에이전트 실행. 웹 브라우징, 코드 작성/디버깅, 태스크 계획을 로컬 LLM으로 처리. 보이스 지원. GitHub 24.4k+ 스타.

트렌드
오픈소스
읽기
2026년 1월 29일

Mistral Vibe CLI - 오픈소스 코딩 에이전트

Mistral의 오픈소스(Apache 2.0) CLI 코딩 어시스턴트. Devstral 2(SWE-bench 72.2%) 기반. 터미널에서 자연어로 코드베이스 탐색/수정/실행. 프로젝트 컨텍스트 자동 인식, Git 상태 반영, 멀티파일 오케스트레이션. Claude Sonnet 대비 7배 비용 효율적. 현재 API 무료.

트렌드
오픈소스
읽기
2026년 1월 29일

Hunyuan 3D - Tencent 3D 생성 AI

Tencent의 AI 3D 생성 플랫폼. 텍스트/이미지/스케치로 고품질 3D 에셋 생성. 2단계 DiT 아키텍처(형태→텍스처 분리). 며칠 걸리던 작업을 분 단위로 단축. OBJ/GLB 출력, Unity/Unreal/Blender 호환. HuggingFace 260만+ 다운로드. 무료 20회/일 제공.

트렌드
오픈소스
읽기
읽을거리로 돌아가기