태그

#모델

78개의 글이 이 태그 아래에 있습니다.

이동

2026년 5월 2일

NVIDIA Nemotron 3 Nano Omni — multimodal agent 스택이 모델 조합에서 단일 perception sub-agent로 수렴

NVIDIA는 2026년 4월 28일 vision·audio·video·text를 한 모델에서 처리하는 오픈 multimodal reasoning model Nemotron 3 Nano Omni를 발표했다. 이 모델은 30B-A3B hybrid MoE, 256K context를 기반으로 document intelligence·video/audio understanding…

오픈소스

2026년 4월 30일

Qwen3.6 — 오픈 코딩 모델 경쟁이 벤치마크보다 저장된 추론과 레포 단위 작업 완성도로 이동

Qwen 팀은 2026년 4월 Qwen3.6 시리즈를 공개하며 35B-A3B와 27B 모델을 순차 배포했다. 공식 저장소 기준으로 이번 릴리스는 agentic coding, front-end workflow, repository-level reasoning 강화와 함께 conversation history 전반에 thinking context를 유지하는 Thinking…

모델

2026년 4월 26일

Nemotron-Personas-Korea — 한국 실제 분포 기반 합성 페르소나 데이터셋

NVIDIA가 공개한 한국어 합성 페르소나 데이터셋으로, 한국의 공개 통계와 지역·직업·교육 등 사회적 분포를 바탕으로 100만 개 규모의 페르소나 레코드를 구성한 자료다. 한국어 모델 학습과 시뮬레이션에서 한국형 맥락을 반영하는 데 참고할 수 있다. 소버린 AI, 한국어 LLM 학습, 합성 데이터 다양성 확대 관점에서 볼 만하다. 영어권 중심 페르소나 데이터셋으로는 놓치기 쉬운 지역성과…

모델

2026년 4월 25일

DeepSeek V4 Preview — 오픈 모델 경쟁이 성능 추격에서 가격·맥락 길이·지정학적 자립성의 복합전으로 이동

DeepSeek는 2026년 4월 24일 V4 Preview를 공개했다. V4 Pro는 1.6T total / 49B active parameters, V4 Flash는 284B total / 13B active parameters를 갖고 두 모델 모두 1M token context를 지원하며, Flash는 입력 토큰 100만 개당 0.14달러로 제시됐다. 🔍 왜 주목해야 하나 이 발표의…

모델

2026년 4월 25일

Mistral 3 — 오픈 모델 경쟁이 단일 플래그십에서 full-stack open portfolio 전략으로 이동

Mistral AI는 최근 Mistral 3를 공개하며 675B total / 41B active의 Mistral Large 3와 3B·8B·14B 규모의 Ministral 3 시리즈를 함께 내놨다. 전 모델을 Apache 2.0으로 공개하고, Large 3는 8×A100 또는 8×H100 단일 노드 배포 경로, 소형 모델은 edge·robotics 환경까지 겨냥하며 배포 범위를 넓혔다.…

모델

2026년 4월 24일

GPT-Rosalind for life sciences — frontier model 경쟁이 범용 지능에서 도메인 특화 연구 워크플로로 확장

OpenAI는 2026년 4월 16일 biology, drug discovery, translational medicine 연구용 모델인 GPT-Rosalind를 research preview로 공개했다. 이 모델은 ChatGPT, Codex, API에서 qualified customer 대상으로 제공되며, LABBench2의 11개 과제 중 6개에서 GPT-5.4를 앞섰고, Codex 앱…

OpenAI

2026년 4월 24일

Introducing GPT-5.5 — 에이전트형 지식노동의 병목이 모델 성능보다 실행 효율과 자율성 설계로 이동

OpenAI는 2026년 4월 23일 GPT-5.5를 공개했고, 4월 24일에는 API 제공까지 시작했다. GPT-5.5는 Terminal-Bench 2.0에서 82.7%, SWE-Bench Pro에서 58.6%, GDPval에서 84.9%, OSWorld-Verified에서 78.7%를 기록하며 GPT-5.4 대비 더 높은 성능과 더 낮은 토큰 사용량을 동시에 내세웠다. 🔍 왜 주목해야…

OpenAI

2026년 4월 23일

ChatGPT Images 2.0

ChatGPT Images 2.0 소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

#모델

NVIDIA Nemotron 3 Nano Omni — multimodal agent 스택이 모델 조합에서 단일 perception sub-agent로 수렴

Qwen3.6 — 오픈 코딩 모델 경쟁이 벤치마크보다 저장된 추론과 레포 단위 작업 완성도로 이동

Nemotron-Personas-Korea — 한국 실제 분포 기반 합성 페르소나 데이터셋

DeepSeek V4 Preview — 오픈 모델 경쟁이 성능 추격에서 가격·맥락 길이·지정학적 자립성의 복합전으로 이동

Mistral 3 — 오픈 모델 경쟁이 단일 플래그십에서 full-stack open portfolio 전략으로 이동

GPT-Rosalind for life sciences — frontier model 경쟁이 범용 지능에서 도메인 특화 연구 워크플로로 확장

Introducing GPT-5.5 — 에이전트형 지식노동의 병목이 모델 성능보다 실행 효율과 자율성 설계로 이동

ChatGPT Images 2.0

OpenAI Privacy Filter — privacy 인프라가 규칙 기반 필터에서 로컬 실행 가능한 specialist model로 이동

The local LLM ecosystem doesn’t need Ollama

Gemini 3.1 Flash TTS: 음성 AI의 경쟁 축이 품질에서 제어 가능성으로 이동

Gemini Robotics-ER 1.6: Google이 embodied reasoning을 산업용 로봇 제어면으로 끌어올리다

Introducing Muse Spark — Meta가 consumer AI를 단일 챗봇에서 멀티모달 subagent 경험으로 재설계

Mistral Small 4 공개 — 오픈 모델 전략이 단일 체크포인트에서 다기능 통합형 reasoning stack으로 이동

Claude Opus 4.7

Hugging Face State of Open Source Spring 2026 — 오픈 모델 경쟁의 축이 성능에서 주권·배포·파생 생태계로 이동

SuperGemma4-26B MLX 4-bit v2

Gemma 4 공개 — Google이 open model 전략을 Apache 2.0과 on-device 배포로 다시 밀어붙이다

Mistral 3 공개 — 오픈 멀티모달 모델 경쟁이 frontier급과 edge급 이중 전선으로 재편되다

Meta, Muse Spark 공개 — Meta AI를 'social-context aware' personal superintelligence로 재정의

Cursor, warp decode 공개 — Blackwell 기반 MoE 추론을 1.84x 가속하며 정확도도 개선

AirLLM — 4GB GPU에서 70B LLM 돌리는 초경량 추론 라이브러리

Google Gemma 4 공개 — Apache 2.0·256K 컨텍스트·멀티모달, 오픈 에이전틱 모델의 새 기준

PrismML, Bonsai 1-bit LLM 출시 — 1GB 메모리로 8B 추론, 엣지 AI의 현실화

Google TurboQuant — KV Cache 6배 압축·H100 어텐션 8배 가속, 정확도 손실 제로로 LLM 서빙 비용 구조 재정의

Google Gemini 3.1 Flash Live 공개 — 실시간 음성 에이전트용 오디오 모델, ComplexFuncBench Audio 90.8%

NVIDIA Blackwell Ultra, MLPerf Inference v6.0 신기록 — 288 GPU로 DeepSeek-R1 초당 249만 토큰 처리

Arcee Trinity-Large-Thinking 출시 — 미국계 오픈 에이전트 모델이 가격 대비 frontier 경쟁력 제시

Gemma 4 공개 — Apache 2.0 오픈 모델을 agentic workflow 중심으로 재정의

Microsoft, MAI 모델 3종 출시 — Foundry를 독자 멀티모달 모델 유통 채널로 본격 전환

Alibaba Qwen3.6-Plus 공개 — 1M 컨텍스트·에이전트 코딩, Claude Opus 4.5 수준 달성

Google Gemini 3.1 Flash-Lite 출시 — Pro 대비 1/8 가격에 Gemini 2.5 Flash 동등 성능

PrismML Bonsai — 세계 최초 상용 가능 1-bit LLM, iPhone에서 44 tok/s 달성

NVIDIA Nemotron 3 Super — 120B MoE 오픈소스 에이전트 모델, SWE-Bench 60.5% 달성

Google TurboQuant — LLM KV 캐시 메모리 6배 압축, H100에서 8배 속도 향상

GPT-5.4 출시 — 추론·코딩·에이전트 통합 모델, OSWorld-V 인간 기준선 AI 최초 초과

Google TurboQuant — KV 캐시를 3비트로 6배 압축, 재학습 없이 H100에서 8배 처리량

GPT-5.4 출시 — 컴퓨터 사용 에이전트로 인간 기준선(OSWorld 72%) 돌파

Mistral Voxtral TTS — 4B 오픈소스 음성 합성 모델, ElevenLabs 대비 7~9배 저렴

NVIDIA Nemotron 3 Super — 120B Mamba-Transformer MoE 오픈 에이전트 모델, 이전 대비 5배 처리량

Google TurboQuant — LLM KV 캐시 3.5비트 압쳙으로 메모리 6배 절감, 오픈소스 공개

OpenAI, $1,200억 역대 최대 평더링 완료 — Amazon $500억 주도, 기업가치 $7,300억 돌파

Anthropic Mythos 유출 — 코딩·사이버보안 SOTA, "역량의 단계적 도약" 확인

Alibaba Qwen 3.5 소형 모델 공개 — 9B 파라미터로 GPT-OSS-120B 능가, Apache 2.0 오픈소스

Google TurboQuant, LLM KV 캐시 메모리 6배 절감 — 3-bit 양자화로 H100에서 8배 속도 향상

Mistral Small 4 (22B), 오픈소스 추론 벤치마크 1위 — 자기 3~5배 규모 클로즈드 모델 추월

Yann LeCun의 AMI Labs, 유럽 역대 최대 시드 $10.3억 조달 — NVIDIA·베이조스 익스피디션 참여

Anthropic, 데이터 누출로 공개된 차세대 모델 'Claude Mythos' — 사이버보안 역사상 가장 강력한 AI

Google TurboQuant, LLM KV 캐시 6배 압축 — 재학습 없이 H100에서 8배 처리량 향상

Mistral Small 4, 119B MoE 모델 Apache 2.0 오픈소스 출시 — GPT-OSS 120B 능가하며 추론 효율도 앞서

Anthropic 'Claude Mythos(Capybara)' 유출 — Opus 4.6 대비 코딩·추론·사이버보안 SOTA, 전례 없는 보안 리스크 공식 경고

ARC-AGI-3 출시 — 인간 100% vs 최고 AI 0.37%, 진정한 적응 학습을 요구하는 새로운 AGI 벤치마크

Mistral Small 4 출시 — 119B MoE (활성 6.5B), Apache 2.0, 추론·멀티모달·코딩 단일 모델 통합

Alibaba Qwen 3.5 Small 시리즈 출시: 9B 모델이 GPT 120B를 벤치마크에서 앞질러

Gartner: 2030년까지 1조 파라미터 LLM 추론 비용 90% 하락 예측

Google TurboQuant: KV-cache 6배 압축으로 LLM 메모리 혁신, ICLR 2026 발표

Google TurboQuant: LLM KV-Cache 6배 압축 달성, 메모리 반도체 시장 직격

Mistral Small 4 (22B, Apache 2.0): 자신보다 3~5배 큰 클로즈드 모델 추론 성능 압도

Yann LeCun의 AMI Labs, 유럽 최대 시드 $10.3억 조달 — JEPA 월드모델로 Transformer 패러다임에 정면 도전

Google TurboQuant — LLM KV 캐시 6배 압축, 정확도 손실 제로 달성 (ICLR 2026)

Mistral Small 4 출시 — 119B MoE, 친지드 추론+비전 통합, Apache 2.0 오픈소스

NVIDIA Nemotron 3 Super 공개 — 120B 하이브리드 MoE 오픈 에이전틱 AI 모델 Apache 2.0

ARC-AGI-3 출시 — 프론티어 모델 전부 1% 미만, AGI와의 간극 재확인

Google TurboQuant, LLM KV 캐시 6배 압축 — 정확도 손실 0%

Mistral Small 4 출시 — 119B MoE, 추론·비전·코딩 통합 오픈소스 모델 (Apache 2.0)

Alibaba Qwen 3.5 Small: 9B 모델이 GPT-oss-120B를 GPQA Diamond에서 추월

Google TurboQuant: LLM KV 캐시 6배 압축, 정확도 손실 제로 달성

OpenAI, GPT-oss-120B/20B 오픈 웨이트 모델 Apache 2.0으로 공개

LLMs work best when the user defines their acceptance criteria first

The L in "LLM" Stands for Lying

GPT-5.4

How do I cancel my ChatGPT subscription?

OpenAI agrees with Dept. of War to deploy models in their classified network

Google API keys weren't secrets, but then Gemini changed the rules

“Car Wash” test with 53 models

Gemini 3.1 Pro

Claude Sonnet 4.6

Gemini 3 Deep Think

#모델