주제

#API

69개 읽을거리를 모았습니다.

2026년 6월 26일

HF Jobs vLLM server - throwaway OpenAI-compatible endpoints get pay-per-second GPUs

Hugging Face는 HF Jobs에서 vLLM server를 한 번의 CLI 명령으로 띄워 private OpenAI-compatible LLM endpoint를 만들 수 있는 흐름을 공개했다. 서버 프로비저닝이나 Kubernetes 없이 pay-per-second GPU 인프라에서 테스트, eval, batch generation 용도로 빠르게 사용할 수 있다는 점을 전면에 내세웠다.

개발도구

읽기

2026년 6월 21일

Arcade Series A — enterprise agents need an authorization layer, not just MCP gateways

Arcade.dev는 SYN Ventures 주도, Morgan Stanley와 Wipro 참여로 6,000만 달러 Series A를 유치해 누적 7,200만 달러를 확보했다고 발표했다. 회사는 production AI agent를 위한 secure action layer를 표방하며 authorization, reliability, governance를 핵심 문제로 제시한다.

에이전트

읽기

2026년 6월 19일

ChatGPT Enterprise spend controls — AI 도입의 병목이 모델 접근에서 비용 거버넌스로 이동

OpenAI는 2026년 6월 18일 ChatGPT Enterprise에 credit usage analytics와 업데이트된 spend controls를 도입해 관리자에게 사용자·제품·모델별 사용량과 비용 가시성을 제공한다고 발표했다.

OpenAI

읽기

2026년 6월 7일

WWDC26 Apple Intelligence APIs — on-device model access가 앱 기능에서 workflow substrate로 확장

Apple은 WWDC26 시점에 Apple Intelligence 개발 표면을 확대하며, App Intents 기반 Use Model action으로 앱이 on-device 또는 Private Cloud Compute 모델 응답을 Shortcut 흐름에 직접 연결할 수 있게 했다. 동시에 Xcode 26.3은 Anthropic과 OpenAI의 coding agents를 IDE 안에서 호출해…

API

읽기

2026년 5월 26일

Anthropic acquires Stainless — 에이전트 경쟁의 병목이 모델 지능에서 connector supply chain 통제로 이동

Anthropic은 2026년 5월 18일 SDK·CLI·MCP server 생성 툴링 회사 Stainless를 인수한다고 발표했다. Anthropic은 Stainless가 자사 공식 SDK를 초기부터 생성해 왔으며, 수백 개 기업이 Stainless를 사용해 TypeScript·Python·Go·Java 등 다수 언어용 SDK와 MCP server를 만들고 있다고 설명했다.

Claude

읽기

2026년 5월 24일

Circle Agent Stack — 에이전트 경제의 병목이 추론이 아니라 결제·지갑·서비스 발견 계층으로 이동한다

Circle은 2026년 5월 11일 Circle Agent Stack을 발표하며 Circle CLI, Agent Wallets, Agent Marketplace, 그리고 Circle Gateway 기반 nanopayments를 공개했다. 목표는 AI agent가 USDC로 자산을 보유하고, 서비스 탐색과 결제를 machine-speed로 수행하는 경제 인프라를 제공하는 것이다.

에이전트

읽기

2026년 5월 24일

Docusign Unveils AI Assistant and Agents — 계약 시스템이 문서 저장소에서 실행형 workflow surface로 바뀐다

Docusign은 2026년 5월 21일 Intelligent Agreement Management(IAM) 위에 AI assistant, agents, Agent Studio, AI-assisted Web Forms, 그리고 Docusign MCP beta를 발표했다. early access는 미국에서 즉시 시작됐고, AI assistant·agents·Agent Studio는 7월부터…

에이전트

읽기

2026년 5월 23일

Chrome DevTools for agents 1.0 — 코딩 에이전트가 정적 코드 생성에서 브라우저 런타임 검증으로 이동

Chrome 팀은 2026년 5월 19일 Chrome DevTools for agents 1.0을 stable로 공개했다. 이번 릴리스는 MCP server, token-efficient CLI, agent skills를 통해 코딩 에이전트가 실제 브라우저에서 앱을 열고 Lighthouse audit, device/network emulation, 성능·접근성 검증까지 직접 수행할 수 있게…

개발도구

읽기

2026년 5월 23일

Honeycomb Agent Observability — 에이전트 운영 경쟁이 프롬프트 품질에서 trace 재구성과 조사 자동화로 이동

Honeycomb는 2026년 5월 12일 Agent Timeline, Canvas Agent, Canvas Skills를 포함한 Agent Observability 기능군을 공개했다. 이 기능은 LLM call, tool invocation, agent handoff, downstream system impact를 하나의 production observability layer에서…

에이전트

읽기

2026년 5월 21일

WebMCP — 브라우저 에이전트 통합이 DOM 추론에서 구조화된 tool surface로 이동

Chrome 팀은 2026년 5월 18일 WebMCP를 공개했다. 이는 웹페이지가 JavaScript와 HTML annotation을 통해 agent용 structured tools를 노출하게 하는 제안 표준으로, agent가 버튼과 폼의 의미를 DOM에서 추론하는 대신 checkout, filter_results, submit_application 같은 명시적 tool을 호출하게 한다.

에이전트

읽기

2026년 5월 20일

Amazon Bedrock AgentCore Payments — AI agent 수익화 인프라가 결제 API가 아니라 runtime primitive가 되기 시작

AWS는 2026년 5월 7일 Amazon Bedrock AgentCore Payments preview를 발표했다. Coinbase와 Stripe와 함께 만든 이 기능은 AI agent가 API, MCP server, 웹 콘텐츠, 다른 agent에 대해 autonomous payment를 수행할 수 있게 하며, x402 negotiation, wallet authentication,…

에이전트

읽기

2026년 5월 19일

AWS MCP Server GA — agent access 제어가 프롬프트 품질보다 클라우드 운영성의 핵심이 된다

AWS는 2026년 5월 6일 AWS MCP Server의 general availability를 발표했다. 이 서버는 IAM·SigV4 기반 인증, AWS-MCP CloudWatch metrics, CloudTrail 로깅, sandboxed script execution, 그리고 Agent SOPs에서 Skills로의 전환을 포함해 AI coding agent가 AWS에 안전하게…

개발도구

읽기

2026년 5월 19일

Claude Managed Agents updates — self-hosted sandbox와 MCP tunnel이 enterprise agent 경계를 재정의

Anthropic은 2026년 5월 19일 Claude Managed Agents에 self-hosted sandboxes와 MCP tunnels를 추가했다고 발표했다. self-hosted sandbox는 public beta, MCP tunnels는 research preview로 제공되며, agent loop는 Anthropic 인프라에 남기되 실제 tool execution과…

Claude

읽기

2026년 5월 18일

Anthropic acquires Stainless — 에이전트 경쟁의 병목이 모델 성능에서 SDK·MCP 연결성으로 이동

Anthropic은 2026년 5월 18일 SDK 및 MCP server tooling 회사 Stainless를 인수한다고 발표했다. Stainless는 2022년 설립 이후 Anthropic의 공식 SDK 전부를 생성해 왔고, API spec으로부터 TypeScript, Python, Go, Java, Kotlin 등의 SDK, CLI, MCP server를 만드는 툴링을 제공해 왔다.

Claude

읽기

2026년 5월 17일

OpenAI realtime voice models — 음성 인터페이스가 STT/TTS를 넘어 실시간 reasoning·translation 런타임으로 진화

OpenAI는 2026년 5월 7일 API용 음성 모델 3종을 발표했다. GPT-Realtime-2는 GPT-5급 추론을 실시간 음성 상호작용에 넣었고, GPT-Realtime-Translate는 70개 이상 입력 언어를 13개 출력 언어로 동시 통역하며, GPT-Realtime-Whisper는 저지연 전사를 제공한다.

OpenAI

읽기

2026년 5월 15일

Claude Platform on AWS GA — 모델 선택 경쟁이 계정·과금·감사 경계까지 포함한 유통 경쟁으로 이동

AWS는 2026년 5월 11일 Claude Platform on AWS의 general availability를 발표했다. 고객은 별도 Anthropic 계정 없이 기존 AWS 계정, IAM, CloudTrail, 통합 과금 체계 안에서 Claude APIs, Console, Managed Agents(beta), MCP connector(beta), Skills(beta), code…

Claude

읽기

2026년 5월 13일

OpenAI Daybreak — AI 코딩 보안이 사후 점검에서 지속적 cyber defense control plane으로 이동

OpenAI는 2026년 5월 12일 무렵 공개된 Daybreak 페이지에서 Codex 기반의 cyber defense 구상을 제품 표면으로 끌어올렸다. GPT-5.5, GPT-5.5 with Trusted Access for Cyber, GPT-5.5-Cyber의 3단계 접근 모델과 함께 secure code review, patch validation, dependency risk…

OpenAI

읽기

2026년 5월 12일

Mistral SDK supply-chain advisory — AI 개발도구 리스크가 모델 품질보다 패키지 공급망 검증으로 이동

Mistral은 2026년 5월 12일 TanStack supply chain attack affecting Mistral AI SDK packages advisory를 게시했다. 노출 구간 동안 npm 패키지 @mistralai/mistralai 2.2.2~2.2.4, Azure/GCP 변형 1.7.1~1.7.3, 그리고 PyPI mistralai==2.4.6가 영향권에 있었고, PyPI…

개발도구

읽기

2026년 5월 11일

Databricks Unity AI Gateway — 에이전트·LLM·MCP를 하나의 거버넌스 계층으로 묶는 플랫폼화

Databricks는 2026년 5월 6~7일 기준 문서 업데이트를 통해 Unity AI Gateway와 새 agent/MCP 문서를 전면 공개했다. 이 Beta 계층은 LLM endpoint, coding agent, MCP server를 하나의 control plane에서 관리하고, multi-agent orchestration 템플릿은 OpenAI Agents SDK 기반으로…

에이전트

읽기

2026년 5월 11일

Stable Animation SDK — 생성형 이미지 모델 경쟁이 정적 이미지에서 프로그래머블 모션 파이프라인으로 확장

Stability AI는 2026년 5월 11일 Stable Animation SDK를 발표했다. 이 SDK는 Stability의 animation endpoint를 통해 text-to-animation, image+text-to-animation, video+text-to-animation 세 경로를 제공하며, Stable Diffusion 2.0과 SDXL 계열 모델을 개발자용…

API

읽기

2026년 5월 10일

Introducing agent quality optimization in AgentCore, now in preview — agent 운영의 병목이 프롬프트 수정이 아니라 trace 기반 품질 피드백 루프로 이동

AWS는 2026년 5월 4일 AgentCore의 agent quality optimization preview를 발표했다. 이 기능은 production trace를 기반으로 개선 권고를 생성하고, batch evaluation과 A/B testing으로 검증한 뒤 배포까지 이어지는 품질 개선 루프를 AgentCore 안에서 다루도록 설계됐다.

에이전트

읽기

2026년 5월 10일

Secure AI agents with Amazon Bedrock AgentCore Identity on Amazon ECS — agent 보안의 핵심이 API 키 저장이 아니라 사용자 위임 세션 결속으로 이동

AWS는 2026년 5월 5일 Amazon Bedrock AgentCore Identity를 Amazon ECS에서 사용하는 참조 아키텍처를 공개했다. 이 구현은 Authorization Code Grant(3-legged OAuth), session binding, scoped token, token vault를 조합해 agent가 사용자 대신 GitHub 같은 외부 서비스에 접근할 때…

에이전트

읽기

2026년 5월 8일

Agents that transact: Introducing Amazon Bedrock AgentCore Payments, built with Coinbase and Stripe — 에이전트 경제가 결제 실험에서 런타임 인프라로 이동

AWS는 2026년 5월 7일 Amazon Bedrock AgentCore Payments preview를 발표했다. 이 기능은 AI agent가 APIs, MCP servers, web content, 다른 agents 같은 유료 리소스에 접근할 때 Coinbase·Stripe 기반 지갑을 통해 실행 루프 안에서 즉시 micropayment를 처리하고, 세션별 spending limit와…

에이전트

읽기

2026년 5월 8일

Introducing OS Level Actions in Amazon Bedrock AgentCore Browser — 브라우저 에이전트가 DOM 자동화를 넘어 OS 제어로 확장

AWS는 2026년 5월 5일 Amazon Bedrock AgentCore Browser에 OS Level Actions를 추가했다. 이제 agent는 InvokeBrowser API를 통해 mouse click, move, drag, scroll, key type, key press, shortcut, screenshot 등 8개 액션을 사용해 DOM 바깥의 native dialog와…

에이전트

읽기

2026년 5월 7일

Advancing voice intelligence with new models in the API — voice AI 경쟁이 STT/TTS를 넘어 realtime agent runtime으로 이동

OpenAI는 2026년 5월 7일 Realtime API용 새 음성 모델 3종 GPT-Realtime-2, GPT-Realtime-Translate, GPT-Realtime-Whisper를 공개했다. GPT-Realtime-2는 컨텍스트 윈도를 32K에서 128K로 늘리고 병렬 tool call, 조정 가능한 reasoning effort, 더 강한 recovery behavior를…

OpenAI

읽기

2026년 5월 7일

Secret scanning with GitHub MCP Server is now generally available — AI 코딩 보안이 PR 이후 탐지에서 pre-commit agent guardrail로 이동

GitHub는 2026년 5월 5일 GitHub MCP Server의 secret scanning 기능이 general availability에 들어갔다고 발표했다. 이제 MCP 호환 AI 코딩 에이전트와 IDE가 커밋이나 PR 전에 노출된 secret을 직접 스캔할 수 있고, 기존 push protection customization도 그대로 존중한다.

개발도구

읽기

2026년 5월 6일

Gemini API File Search is now multimodal — RAG 경쟁이 text retrieval에서 multimodal evidence layer로 이동

Google은 2026년 5월 5일 Gemini API File Search에 multimodal support, custom metadata, page-level citations를 추가했다. 이제 텍스트와 이미지를 함께 색인·검색할 수 있고, metadata filter로 검색 범위를 줄이며, 응답마다 원문 페이지 단위 citation을 붙여 verifiable RAG를 구성할 수 있다.

Gemini

읽기

2026년 5월 5일

Reduce friction and latency for long-running jobs with Webhooks in Gemini API — agent 런타임의 핵심이 polling이 아니라 event-driven orchestration으로 이동

Google은 2026년 5월 4일 Gemini API에 Webhooks를 도입해 Batch API·Deep Research·장시간 생성 작업의 완료 이벤트를 HTTP POST로 push할 수 있게 했다. 구현은 Standard Webhooks 스펙을 따르며 webhook-signature, webhook-id, webhook-timestamp 기반 서명, 최대 24시간 자동 재시도,…

API

읽기

2026년 5월 1일

Snowflake Intelligence and Cortex Code — enterprise AI control plane 경쟁이 MCP·plugin·cloud agent로 확장

Snowflake는 2026년 4월 21일 Snowflake Intelligence와 Cortex Code 업데이트를 발표하며, enterprise AI의 control plane 포지션을 강화했다. Cortex Code는 AWS Glue·Databricks·Postgres 지원 확대, MCP/ACP 연동, VS Code extension과 Claude Code plugin,…

에이전트

읽기

2026년 5월 1일

The AI engineering stack we built internally — agent 도입 경쟁이 모델 선택에서 사내 infra maturity로 이동

Cloudflare는 2026년 4월 20일 자사 내부 AI engineering stack을 공개하며, 최근 30일 기준 R&D 조직의 93%가 사내 AI 코딩 도구를 사용했고 AI Gateway를 통해 241.37B tokens, Workers AI에서 51.47B input tokens를 처리했다고 밝혔다. 다음 단계로는 MCP portal, git, test runner를 그대로…

개발도구

읽기

2026년 4월 30일

Prepay for the Gemini API to get more control over your spend — 에이전트 경제성이 기능보다 먼저 제품 표면으로 올라오다

Google은 2026년 4월 15일 Google AI Studio용 Gemini API Prepay Billing을 발표했다. 신규 Google Cloud Billing Account를 여는 미국 사용자부터 선불 크레딧 기반 결제를 쓸 수 있고, 자동 충전과 함께 남은 잔액을 기준으로 API 호출 비용을 관리하게 해 spend predictability를 높이겠다는 내용이다.

Gemini

읽기

2026년 4월 20일

Voicebox — 로컬에서 음성 복제·TTS를 다루는 오픈소스 보이스 스튜디오

Voicebox는 음성 복제, 다국어 TTS, 후처리 효과, 멀티 보이스 편집을 한곳에서 다루는 로컬 우선 음성 합성 스튜디오다. 클라우드형 음성 서비스의 대안으로 제시되며, 여러 TTS 엔진을 바꿔가며 테스트하고 REST API로 앱에 붙일 수 있게 설계됐다. 볼 만한 이유는 단순한 모델 데모가 아니라 실제 제작 워크플로우에 가까운 구조를 갖췄기 때문이다. 몇 초짜리 샘플로 보이스…

SQL MCP Server 공개 — 데이터베이스 연결이 NL2SQL 실험에서 통제형 agent interface로 이동한다

Microsoft는 2026년 4월 8일 SQL MCP Server를 공개했다. Data API builder 기반의 이 서버는 Microsoft SQL, PostgreSQL, Azure Cosmos DB, MySQL을 지원하며, RBAC·Key Vault·OpenTelemetry·REST/GraphQL/MCP 동시 노출과 함께 AI agent용 고정 DML 도구 집합을 제공한다.

#API

HF Jobs vLLM server - throwaway OpenAI-compatible endpoints get pay-per-second GPUs

Arcade Series A — enterprise agents need an authorization layer, not just MCP gateways

ChatGPT Enterprise spend controls — AI 도입의 병목이 모델 접근에서 비용 거버넌스로 이동

WWDC26 Apple Intelligence APIs — on-device model access가 앱 기능에서 workflow substrate로 확장

Anthropic acquires Stainless — 에이전트 경쟁의 병목이 모델 지능에서 connector supply chain 통제로 이동

Circle Agent Stack — 에이전트 경제의 병목이 추론이 아니라 결제·지갑·서비스 발견 계층으로 이동한다

Docusign Unveils AI Assistant and Agents — 계약 시스템이 문서 저장소에서 실행형 workflow surface로 바뀐다

Chrome DevTools for agents 1.0 — 코딩 에이전트가 정적 코드 생성에서 브라우저 런타임 검증으로 이동

Honeycomb Agent Observability — 에이전트 운영 경쟁이 프롬프트 품질에서 trace 재구성과 조사 자동화로 이동

WebMCP — 브라우저 에이전트 통합이 DOM 추론에서 구조화된 tool surface로 이동

Amazon Bedrock AgentCore Payments — AI agent 수익화 인프라가 결제 API가 아니라 runtime primitive가 되기 시작

AWS MCP Server GA — agent access 제어가 프롬프트 품질보다 클라우드 운영성의 핵심이 된다

Claude Managed Agents updates — self-hosted sandbox와 MCP tunnel이 enterprise agent 경계를 재정의

Anthropic acquires Stainless — 에이전트 경쟁의 병목이 모델 성능에서 SDK·MCP 연결성으로 이동

OpenAI realtime voice models — 음성 인터페이스가 STT/TTS를 넘어 실시간 reasoning·translation 런타임으로 진화

Claude Platform on AWS GA — 모델 선택 경쟁이 계정·과금·감사 경계까지 포함한 유통 경쟁으로 이동

OpenAI Daybreak — AI 코딩 보안이 사후 점검에서 지속적 cyber defense control plane으로 이동

Mistral SDK supply-chain advisory — AI 개발도구 리스크가 모델 품질보다 패키지 공급망 검증으로 이동

Databricks Unity AI Gateway — 에이전트·LLM·MCP를 하나의 거버넌스 계층으로 묶는 플랫폼화

Stable Animation SDK — 생성형 이미지 모델 경쟁이 정적 이미지에서 프로그래머블 모션 파이프라인으로 확장

Introducing agent quality optimization in AgentCore, now in preview — agent 운영의 병목이 프롬프트 수정이 아니라 trace 기반 품질 피드백 루프로 이동

Secure AI agents with Amazon Bedrock AgentCore Identity on Amazon ECS — agent 보안의 핵심이 API 키 저장이 아니라 사용자 위임 세션 결속으로 이동

Agents that transact: Introducing Amazon Bedrock AgentCore Payments, built with Coinbase and Stripe — 에이전트 경제가 결제 실험에서 런타임 인프라로 이동

Introducing OS Level Actions in Amazon Bedrock AgentCore Browser — 브라우저 에이전트가 DOM 자동화를 넘어 OS 제어로 확장

Advancing voice intelligence with new models in the API — voice AI 경쟁이 STT/TTS를 넘어 realtime agent runtime으로 이동

Secret scanning with GitHub MCP Server is now generally available — AI 코딩 보안이 PR 이후 탐지에서 pre-commit agent guardrail로 이동

Gemini API File Search is now multimodal — RAG 경쟁이 text retrieval에서 multimodal evidence layer로 이동

Reduce friction and latency for long-running jobs with Webhooks in Gemini API — agent 런타임의 핵심이 polling이 아니라 event-driven orchestration으로 이동

Snowflake Intelligence and Cortex Code — enterprise AI control plane 경쟁이 MCP·plugin·cloud agent로 확장

The AI engineering stack we built internally — agent 도입 경쟁이 모델 선택에서 사내 infra maturity로 이동

Prepay for the Gemini API to get more control over your spend — 에이전트 경제성이 기능보다 먼저 제품 표면으로 올라오다

Voicebox — 로컬에서 음성 복제·TTS를 다루는 오픈소스 보이스 스튜디오

SQL MCP Server 공개 — 데이터베이스 연결이 NL2SQL 실험에서 통제형 agent interface로 이동한다

Azure MCP Server 2.0 stable — MCP가 로컬 개발 편의 기능을 넘어 중앙 통제형 클라우드 운영 인터페이스가 되다

Dataverse Skills 공개 — 엔터프라이즈 로우코드 플랫폼이 이제 '에이전트가 조작 가능한 시스템'이 되기 시작했다

Google Gemma 4 공개 — Apache 2.0·256K 컨텍스트·멀티모달, 오픈 에이전틱 모델의 새 기준

Domo AI Agent Builder + MCP Server 공개 — 엔터프라이즈 BI가 멀티-LLM AI 에이전트 인프라로 전환하는 첫 사례

Model Context Protocol Servers — MCP 레퍼런스 서버 모음

Semantic Kernel — 엔터프라이즈 지향 에이전트 오케스트레이션 SDK

Google Gemini 3.1 Flash Live 공개 — 실시간 음성 에이전트용 오디오 모델, ComplexFuncBench Audio 90.8%

Google Gemini API, Flex & Priority 인퍼런스 티어 도입 — 비용-신뢰성 트레이드오프를 개발자가 제어

Google Veo 3.1 Lite 출시 — AI 비디오 생성 비용 50% 절감, 개발자용 고용량 API 제공

Arcee Trinity-Large-Thinking 출시 — 미국계 오픈 에이전트 모델이 가격 대비 frontier 경쟁력 제시

Gemma 4 공개 — Apache 2.0 오픈 모델을 agentic workflow 중심으로 재정의

GitHub Copilot SDK 공개 프리뷰 — agent runtime이 제품 기능에서 플랫폼 계층으로 확장

Microsoft, MAI 모델 3종 출시 — Foundry를 독자 멀티모달 모델 유통 채널로 본격 전환

Alibaba Qwen3.6-Plus 공개 — 1M 컨텍스트·에이전트 코딩, Claude Opus 4.5 수준 달성

Google Gemini 3.1 Flash-Lite 출시 — Pro 대비 1/8 가격에 Gemini 2.5 Flash 동등 성능

NVIDIA Nemotron 3 Super — 120B MoE 오픈소스 에이전트 모델, SWE-Bench 60.5% 달성

Linux Foundation, MCP 기부 및 AAIF 출범 — AI 에이전트 표준화의 중립 거버넌스 시대 개막

Google TurboQuant — LLM KV 캐시 메모리 6배 압축, H100에서 8배 속도 향상

GPT-5.4 출시 — 추론·코딩·에이전트 통합 모델, OSWorld-V 인간 기준선 AI 최초 초과

OpenAI, 최초 오픈웨이트 모델 gpt-oss-120b 공개 — Apache 2.0, o4-mini 수준 추론 성능

Google TurboQuant — KV 캐시를 3비트로 6배 압축, 재학습 없이 H100에서 8배 처리량

Mistral Voxtral TTS — 4B 오픈소스 음성 합성 모델, ElevenLabs 대비 7~9배 저렴

NVIDIA Nemotron 3 Super — 120B Mamba-Transformer MoE 오픈 에이전트 모델, 이전 대비 5배 처리량

Google TurboQuant — LLM KV 캐시 3.5비트 압쳙으로 메모리 6배 절감, 오픈소스 공개

MCP 9,700만 설치 돌파 — AI 에이전트 인프라 표준으로 안착, 그러나 보안 위협도 급부상

Mistral Small 4 (22B), 오픈소스 추론 벤치마크 1위 — 자기 3~5배 규모 클로즈드 모델 추월

MCP, 월 9700만 다운로드 돌파 — 16개월 만에 React 수준 생태계, AI 에이전트 필수 인프라로 공식화

Mistral Small 4 출시 — 119B MoE (활성 6.5B), Apache 2.0, 추론·멀티모달·코딩 단일 모델 통합

Mistral Small 4 (22B, Apache 2.0): 자신보다 3~5배 큰 클로즈드 모델 추론 성능 압도

Nvidia GTC 2026: 에이전트 AI 시대 선언 — NemoClaw·Agent Toolkit 오픈소스 공개

Claude Opus 4.6 출시 - 1M 토큰 컨텍스트 & Agent Teams

MiniMax Music - AI 음악 생성

Mistral Vibe CLI - 오픈소스 코딩 에이전트

Hunyuan 3D - Tencent 3D 생성 AI

Gemini 3 Flash - Agentic Vision

MiniMax Agent

#API

HF Jobs vLLM server - throwaway OpenAI-compatible endpoints get pay-per-second GPUs

Arcade Series A — enterprise agents need an authorization layer, not just MCP gateways

ChatGPT Enterprise spend controls — AI 도입의 병목이 모델 접근에서 비용 거버넌스로 이동

WWDC26 Apple Intelligence APIs — on-device model access가 앱 기능에서 workflow substrate로 확장

Anthropic acquires Stainless — 에이전트 경쟁의 병목이 모델 지능에서 connector supply chain 통제로 이동

Circle Agent Stack — 에이전트 경제의 병목이 추론이 아니라 결제·지갑·서비스 발견 계층으로 이동한다

Docusign Unveils AI Assistant and Agents — 계약 시스템이 문서 저장소에서 실행형 workflow surface로 바뀐다

Chrome DevTools for agents 1.0 — 코딩 에이전트가 정적 코드 생성에서 브라우저 런타임 검증으로 이동

Honeycomb Agent Observability — 에이전트 운영 경쟁이 프롬프트 품질에서 trace 재구성과 조사 자동화로 이동