태그

#오픈소스

81개의 글이 이 태그 아래에 있습니다.

이동

2026년 5월 2일

NVIDIA Nemotron 3 Nano Omni — multimodal agent 스택이 모델 조합에서 단일 perception sub-agent로 수렴

NVIDIA는 2026년 4월 28일 vision·audio·video·text를 한 모델에서 처리하는 오픈 multimodal reasoning model Nemotron 3 Nano Omni를 발표했다. 이 모델은 30B-A3B hybrid MoE, 256K context를 기반으로 document intelligence·video/audio understanding…

#오픈소스

NVIDIA Nemotron 3 Nano Omni — multimodal agent 스택이 모델 조합에서 단일 perception sub-agent로 수렴

Warp is now open-source — ADE 경쟁이 제품 기능에서 오픈 에이전트 운영체제로 확장

Qwen3.6 — 오픈 코딩 모델 경쟁이 벤치마크보다 저장된 추론과 레포 단위 작업 완성도로 이동

Nemotron-Personas-Korea — 한국 실제 분포 기반 합성 페르소나 데이터셋

Mistral 3 — 오픈 모델 경쟁이 단일 플래그십에서 full-stack open portfolio 전략으로 이동

Agent Governance Toolkit — 에이전트 보안이 사후 감사에서 runtime kernel 계층으로 이동

Voicebox — 로컬에서 음성 복제·TTS를 다루는 오픈소스 보이스 스튜디오

Mistral Small 4 공개 — 오픈 모델 전략이 단일 체크포인트에서 다기능 통합형 reasoning stack으로 이동

Hugging Face State of Open Source Spring 2026 — 오픈 모델 경쟁의 축이 성능에서 주권·배포·파생 생태계로 이동

Graphify — 코드·문서·영상을 쿼리 가능한 지식 그래프로 변환하는 AI 도구

Open Agents — Vercel용 백그라운드 코딩 에이전트 레퍼런스 앱

colleague.skill - 동료 페르소나 기반 스킬 생성기

CC 베스트 프랙티스 모음

TypeUI - AI 에이전트용 디자인 레이어 CLI

Anthropic downgraded cache TTL on March 6th

Pro Max 5x quota exhausted in 1.5 hours despite moderate usage

Mistral 3 공개 — 오픈 멀티모달 모델 경쟁이 frontier급과 edge급 이중 전선으로 재편되다

Show HN: I built a tiny LLM to demystify how language models work

awesome-design-md — AI 에이전트를 위한 디자인 시스템 컬렉션

Issue: Claude Code is unusable for complex engineering tasks with Feb updates

Hugging Face State of Open Source Spring 2026 — 오픈 모델 경쟁의 무게중심이 미국 중심에서 다극·주권형 생태계로 이동

AirLLM — 4GB GPU에서 70B LLM 돌리는 초경량 추론 라이브러리

Claw Code, Claude Code 소스 유출 계기로 등장한 오픈소스 AI 코딩 에이전트 — 출시 1주일 만에 GitHub 100K stars

Google Gemma 4 공개 — Apache 2.0·256K 컨텍스트·멀티모달, 오픈 에이전틱 모델의 새 기준

PrismML, Bonsai 1-bit LLM 출시 — 1GB 메모리로 8B 추론, 엣지 AI의 현실화

Google TurboQuant — KV Cache 6배 압축·H100 어텐션 8배 가속, 정확도 손실 제로로 LLM 서빙 비용 구조 재정의

Agency Swarm — 조직형 멀티에이전트 오케스트레이션 프레임워크

Agno — 프레임워크·런타임·컨트롤 플레인을 묶은 에이전트 스택

AutoGen — Microsoft의 멀티에이전트 프로그래밍 프레임워크

AutoGPT — 지속 실행형 AI 에이전트 플랫폼

browser-use — 웹사이트를 AI 에이전트용 인터페이스로 바꾸는 브라우저 자동화

CrewAI — 역할 기반 멀티에이전트 협업 프레임워크

Dify — 워크플로·RAG·에이전트를 묶은 프로덕션 플랫폼

LangGraph — 상태를 가진 에이전트를 그래프로 설계하는 프레임워크

Model Context Protocol Servers — MCP 레퍼런스 서버 모음

Semantic Kernel — 엔터프라이즈 지향 에이전트 오케스트레이션 SDK

CLI-Anything — 기존 소프트웨어를 에이전트용 CLI로 바꾸는 프레임워크

Meta BOxCrete 공개 — 데이터센터 콘크리트 배합을 AI로 최적화, 강도 도달 43% 단축

Arcee Trinity-Large-Thinking 출시 — 미국계 오픈 에이전트 모델이 가격 대비 frontier 경쟁력 제시

Gemma 4 공개 — Apache 2.0 오픈 모델을 agentic workflow 중심으로 재정의

vLLM Model Runner V2 출시 — Prefill-Decode 분리 스케줄링으로 오픈소스 LLM 추론 아키텍처 혁신

PrismML Bonsai — 세계 최초 상용 가능 1-bit LLM, iPhone에서 44 tok/s 달성

Claw Code — Claude Code 소스 기반 Python/Rust 클린룸 재구현 프로젝트 (130k★)

NVIDIA Nemotron 3 Super — 120B MoE 오픈소스 에이전트 모델, SWE-Bench 60.5% 달성

Google TurboQuant, LLM KV 캐시 메모리 6배 압축·H100 속도 8배 향상 달성

gstack — Garry Tan(YC 회장)이 만든 AI 소프트웨어 팩토리

Paperclip — AI 에이전트 팀을 회사처럼 운영하는 오케스트레이션 플랫폼

Google TurboQuant — KV 캐시를 3비트로 6배 압축, 재학습 없이 H100에서 8배 처리량

Mistral Voxtral TTS — 4B 오픈소스 음성 합성 모델, ElevenLabs 대비 7~9배 저렴

NVIDIA Nemotron 3 Super — 120B Mamba-Transformer MoE 오픈 에이전트 모델, 이전 대비 5배 처리량

Google TurboQuant — LLM KV 캐시 3.5비트 압쳙으로 메모리 6배 절감, 오픈소스 공개

Alibaba Qwen 3.5 소형 모델 공개 — 9B 파라미터로 GPT-OSS-120B 능가, Apache 2.0 오픈소스

Google TurboQuant, LLM KV 캐시 메모리 6배 절감 — 3-bit 양자화로 H100에서 8배 속도 향상

Mistral Small 4 (22B), 오픈소스 추론 벤치마크 1위 — 자기 3~5배 규모 클로즈드 모델 추월

Google TurboQuant, LLM KV 캐시 6배 압축 — 재학습 없이 H100에서 8배 처리량 향상

Mistral Small 4, 119B MoE 모델 Apache 2.0 오픈소스 출시 — GPT-OSS 120B 능가하며 추론 효율도 앞서

Pretext — DOM 없이 텍스트 측정하는 순수 JS 레이아웃 라이브러리

MCP, 월 9700만 다운로드 돌파 — 16개월 만에 React 수준 생태계, AI 에이전트 필수 인프라로 공식화

Mistral Small 4 출시 — 119B MoE (활성 6.5B), Apache 2.0, 추론·멀티모달·코딩 단일 모델 통합

Alibaba Qwen 3.5 Small 시리즈 출시: 9B 모델이 GPT 120B를 벤치마크에서 앞질러

Google TurboQuant: KV-cache 6배 압축으로 LLM 메모리 혁신, ICLR 2026 발표

Google TurboQuant: LLM KV-Cache 6배 압축 달성, 메모리 반도체 시장 직격

Mistral Small 4 (22B, Apache 2.0): 자신보다 3~5배 큰 클로즈드 모델 추론 성능 압도

Mistral Small 4 출시 — 119B MoE, 친지드 추론+비전 통합, Apache 2.0 오픈소스

NVIDIA Nemotron 3 Super 공개 — 120B 하이브리드 MoE 오픈 에이전틱 AI 모델 Apache 2.0

Mistral Small 4 출시 — 119B MoE, 추론·비전·코딩 통합 오픈소스 모델 (Apache 2.0)

Mistral Voxtral TTS 공개 — 5초 샘플로 음성 복제, 9개 언어 엣지 배포 가능

Alibaba Qwen 3.5 Small: 9B 모델이 GPT-oss-120B를 GPQA Diamond에서 추월

Dapr Agents v1.0 GA: 프로덕션 AI 에이전트의 Kubernetes 클라우드 네이티브 표준

OpenAI, GPT-oss-120B/20B 오픈 웨이트 모델 Apache 2.0으로 공개

Autoresearch - Karpathy의 AI 자동 LLM 훈련 실험 프레임워크

A GitHub Issue Title Compromised 4k Developer Machines

MiniMax M2.5 - 오픈소스 AI 모델, Claude Opus 4.6의 1/20 비용

Playwright CLI - AI 코딩 에이전트용 브라우저 자동화

OpenClaw - 1인 개발자의 초고속 성장 AI 에이전트

Claude Code Agent Teams - 멀티 에이전트 협업

claude-mem - Claude Code 영구 메모리

oh-my-ag - 멀티에이전트 개발 스킬

AgenticSeek - 100% 로컬 AI 에이전트