PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

주제

#API

69개 읽을거리를 모았습니다.
2026년 6월 26일

HF Jobs vLLM server - throwaway OpenAI-compatible endpoints get pay-per-second GPUs

Hugging Face는 HF Jobs에서 vLLM server를 한 번의 CLI 명령으로 띄워 private OpenAI-compatible LLM endpoint를 만들 수 있는 흐름을 공개했다. 서버 프로비저닝이나 Kubernetes 없이 pay-per-second GPU 인프라에서 테스트, eval, batch generation 용도로 빠르게 사용할 수 있다는 점을 전면에 내세웠다.

AI
개발도구
읽기
2026년 6월 21일

Arcade Series A — enterprise agents need an authorization layer, not just MCP gateways

Arcade.dev는 SYN Ventures 주도, Morgan Stanley와 Wipro 참여로 6,000만 달러 Series A를 유치해 누적 7,200만 달러를 확보했다고 발표했다. 회사는 production AI agent를 위한 secure action layer를 표방하며 authorization, reliability, governance를 핵심 문제로 제시한다.

AI
에이전트
읽기
2026년 6월 19일

ChatGPT Enterprise spend controls — AI 도입의 병목이 모델 접근에서 비용 거버넌스로 이동

OpenAI는 2026년 6월 18일 ChatGPT Enterprise에 credit usage analytics와 업데이트된 spend controls를 도입해 관리자에게 사용자·제품·모델별 사용량과 비용 가시성을 제공한다고 발표했다.

AI
OpenAI
읽기
2026년 6월 7일

WWDC26 Apple Intelligence APIs — on-device model access가 앱 기능에서 workflow substrate로 확장

Apple은 WWDC26 시점에 Apple Intelligence 개발 표면을 확대하며, App Intents 기반 Use Model action으로 앱이 on-device 또는 Private Cloud Compute 모델 응답을 Shortcut 흐름에 직접 연결할 수 있게 했다. 동시에 Xcode 26.3은 Anthropic과 OpenAI의 coding agents를 IDE 안에서 호출해…

AI
API
읽기
2026년 5월 26일

Anthropic acquires Stainless — 에이전트 경쟁의 병목이 모델 지능에서 connector supply chain 통제로 이동

Anthropic은 2026년 5월 18일 SDK·CLI·MCP server 생성 툴링 회사 Stainless를 인수한다고 발표했다. Anthropic은 Stainless가 자사 공식 SDK를 초기부터 생성해 왔으며, 수백 개 기업이 Stainless를 사용해 TypeScript·Python·Go·Java 등 다수 언어용 SDK와 MCP server를 만들고 있다고 설명했다.

AI
Claude
읽기
2026년 5월 24일

Circle Agent Stack — 에이전트 경제의 병목이 추론이 아니라 결제·지갑·서비스 발견 계층으로 이동한다

Circle은 2026년 5월 11일 Circle Agent Stack을 발표하며 Circle CLI, Agent Wallets, Agent Marketplace, 그리고 Circle Gateway 기반 nanopayments를 공개했다. 목표는 AI agent가 USDC로 자산을 보유하고, 서비스 탐색과 결제를 machine-speed로 수행하는 경제 인프라를 제공하는 것이다.

AI
에이전트
읽기
2026년 5월 24일

Docusign Unveils AI Assistant and Agents — 계약 시스템이 문서 저장소에서 실행형 workflow surface로 바뀐다

Docusign은 2026년 5월 21일 Intelligent Agreement Management(IAM) 위에 AI assistant, agents, Agent Studio, AI-assisted Web Forms, 그리고 Docusign MCP beta를 발표했다. early access는 미국에서 즉시 시작됐고, AI assistant·agents·Agent Studio는 7월부터…

AI
에이전트
읽기
2026년 5월 23일

Chrome DevTools for agents 1.0 — 코딩 에이전트가 정적 코드 생성에서 브라우저 런타임 검증으로 이동

Chrome 팀은 2026년 5월 19일 Chrome DevTools for agents 1.0을 stable로 공개했다. 이번 릴리스는 MCP server, token-efficient CLI, agent skills를 통해 코딩 에이전트가 실제 브라우저에서 앱을 열고 Lighthouse audit, device/network emulation, 성능·접근성 검증까지 직접 수행할 수 있게…

AI
개발도구
읽기
2026년 5월 23일

Honeycomb Agent Observability — 에이전트 운영 경쟁이 프롬프트 품질에서 trace 재구성과 조사 자동화로 이동

Honeycomb는 2026년 5월 12일 Agent Timeline, Canvas Agent, Canvas Skills를 포함한 Agent Observability 기능군을 공개했다. 이 기능은 LLM call, tool invocation, agent handoff, downstream system impact를 하나의 production observability layer에서…

AI
에이전트
읽기
2026년 5월 21일

WebMCP — 브라우저 에이전트 통합이 DOM 추론에서 구조화된 tool surface로 이동

Chrome 팀은 2026년 5월 18일 WebMCP를 공개했다. 이는 웹페이지가 JavaScript와 HTML annotation을 통해 agent용 structured tools를 노출하게 하는 제안 표준으로, agent가 버튼과 폼의 의미를 DOM에서 추론하는 대신 checkout, filter_results, submit_application 같은 명시적 tool을 호출하게 한다.

AI
에이전트
읽기
2026년 5월 20일

Amazon Bedrock AgentCore Payments — AI agent 수익화 인프라가 결제 API가 아니라 runtime primitive가 되기 시작

AWS는 2026년 5월 7일 Amazon Bedrock AgentCore Payments preview를 발표했다. Coinbase와 Stripe와 함께 만든 이 기능은 AI agent가 API, MCP server, 웹 콘텐츠, 다른 agent에 대해 autonomous payment를 수행할 수 있게 하며, x402 negotiation, wallet authentication,…

AI
에이전트
읽기
2026년 5월 19일

AWS MCP Server GA — agent access 제어가 프롬프트 품질보다 클라우드 운영성의 핵심이 된다

AWS는 2026년 5월 6일 AWS MCP Server의 general availability를 발표했다. 이 서버는 IAM·SigV4 기반 인증, AWS-MCP CloudWatch metrics, CloudTrail 로깅, sandboxed script execution, 그리고 Agent SOPs에서 Skills로의 전환을 포함해 AI coding agent가 AWS에 안전하게…

AI
개발도구
읽기
2026년 5월 19일

Claude Managed Agents updates — self-hosted sandbox와 MCP tunnel이 enterprise agent 경계를 재정의

Anthropic은 2026년 5월 19일 Claude Managed Agents에 self-hosted sandboxes와 MCP tunnels를 추가했다고 발표했다. self-hosted sandbox는 public beta, MCP tunnels는 research preview로 제공되며, agent loop는 Anthropic 인프라에 남기되 실제 tool execution과…

AI
Claude
읽기
2026년 5월 18일

Anthropic acquires Stainless — 에이전트 경쟁의 병목이 모델 성능에서 SDK·MCP 연결성으로 이동

Anthropic은 2026년 5월 18일 SDK 및 MCP server tooling 회사 Stainless를 인수한다고 발표했다. Stainless는 2022년 설립 이후 Anthropic의 공식 SDK 전부를 생성해 왔고, API spec으로부터 TypeScript, Python, Go, Java, Kotlin 등의 SDK, CLI, MCP server를 만드는 툴링을 제공해 왔다.

AI
Claude
읽기
2026년 5월 17일

OpenAI realtime voice models — 음성 인터페이스가 STT/TTS를 넘어 실시간 reasoning·translation 런타임으로 진화

OpenAI는 2026년 5월 7일 API용 음성 모델 3종을 발표했다. GPT-Realtime-2는 GPT-5급 추론을 실시간 음성 상호작용에 넣었고, GPT-Realtime-Translate는 70개 이상 입력 언어를 13개 출력 언어로 동시 통역하며, GPT-Realtime-Whisper는 저지연 전사를 제공한다.

AI
OpenAI
읽기
2026년 5월 15일

Claude Platform on AWS GA — 모델 선택 경쟁이 계정·과금·감사 경계까지 포함한 유통 경쟁으로 이동

AWS는 2026년 5월 11일 Claude Platform on AWS의 general availability를 발표했다. 고객은 별도 Anthropic 계정 없이 기존 AWS 계정, IAM, CloudTrail, 통합 과금 체계 안에서 Claude APIs, Console, Managed Agents(beta), MCP connector(beta), Skills(beta), code…

AI
Claude
읽기
2026년 5월 13일

OpenAI Daybreak — AI 코딩 보안이 사후 점검에서 지속적 cyber defense control plane으로 이동

OpenAI는 2026년 5월 12일 무렵 공개된 Daybreak 페이지에서 Codex 기반의 cyber defense 구상을 제품 표면으로 끌어올렸다. GPT-5.5, GPT-5.5 with Trusted Access for Cyber, GPT-5.5-Cyber의 3단계 접근 모델과 함께 secure code review, patch validation, dependency risk…

AI
OpenAI
읽기
2026년 5월 12일

Mistral SDK supply-chain advisory — AI 개발도구 리스크가 모델 품질보다 패키지 공급망 검증으로 이동

Mistral은 2026년 5월 12일 TanStack supply chain attack affecting Mistral AI SDK packages advisory를 게시했다. 노출 구간 동안 npm 패키지 @mistralai/mistralai 2.2.2~2.2.4, Azure/GCP 변형 1.7.1~1.7.3, 그리고 PyPI mistralai==2.4.6가 영향권에 있었고, PyPI…

AI
개발도구
읽기
2026년 5월 11일

Databricks Unity AI Gateway — 에이전트·LLM·MCP를 하나의 거버넌스 계층으로 묶는 플랫폼화

Databricks는 2026년 5월 6~7일 기준 문서 업데이트를 통해 Unity AI Gateway와 새 agent/MCP 문서를 전면 공개했다. 이 Beta 계층은 LLM endpoint, coding agent, MCP server를 하나의 control plane에서 관리하고, multi-agent orchestration 템플릿은 OpenAI Agents SDK 기반으로…

AI
에이전트
읽기
2026년 5월 11일

Stable Animation SDK — 생성형 이미지 모델 경쟁이 정적 이미지에서 프로그래머블 모션 파이프라인으로 확장

Stability AI는 2026년 5월 11일 Stable Animation SDK를 발표했다. 이 SDK는 Stability의 animation endpoint를 통해 text-to-animation, image+text-to-animation, video+text-to-animation 세 경로를 제공하며, Stable Diffusion 2.0과 SDXL 계열 모델을 개발자용…

AI
API
읽기
2026년 5월 10일

Introducing agent quality optimization in AgentCore, now in preview — agent 운영의 병목이 프롬프트 수정이 아니라 trace 기반 품질 피드백 루프로 이동

AWS는 2026년 5월 4일 AgentCore의 agent quality optimization preview를 발표했다. 이 기능은 production trace를 기반으로 개선 권고를 생성하고, batch evaluation과 A/B testing으로 검증한 뒤 배포까지 이어지는 품질 개선 루프를 AgentCore 안에서 다루도록 설계됐다.

AI
에이전트
읽기
2026년 5월 10일

Secure AI agents with Amazon Bedrock AgentCore Identity on Amazon ECS — agent 보안의 핵심이 API 키 저장이 아니라 사용자 위임 세션 결속으로 이동

AWS는 2026년 5월 5일 Amazon Bedrock AgentCore Identity를 Amazon ECS에서 사용하는 참조 아키텍처를 공개했다. 이 구현은 Authorization Code Grant(3-legged OAuth), session binding, scoped token, token vault를 조합해 agent가 사용자 대신 GitHub 같은 외부 서비스에 접근할 때…

AI
에이전트
읽기
2026년 5월 8일

Agents that transact: Introducing Amazon Bedrock AgentCore Payments, built with Coinbase and Stripe — 에이전트 경제가 결제 실험에서 런타임 인프라로 이동

AWS는 2026년 5월 7일 Amazon Bedrock AgentCore Payments preview를 발표했다. 이 기능은 AI agent가 APIs, MCP servers, web content, 다른 agents 같은 유료 리소스에 접근할 때 Coinbase·Stripe 기반 지갑을 통해 실행 루프 안에서 즉시 micropayment를 처리하고, 세션별 spending limit와…

AI
에이전트
읽기
2026년 5월 8일

Introducing OS Level Actions in Amazon Bedrock AgentCore Browser — 브라우저 에이전트가 DOM 자동화를 넘어 OS 제어로 확장

AWS는 2026년 5월 5일 Amazon Bedrock AgentCore Browser에 OS Level Actions를 추가했다. 이제 agent는 InvokeBrowser API를 통해 mouse click, move, drag, scroll, key type, key press, shortcut, screenshot 등 8개 액션을 사용해 DOM 바깥의 native dialog와…

AI
에이전트
읽기
2026년 5월 7일

Advancing voice intelligence with new models in the API — voice AI 경쟁이 STT/TTS를 넘어 realtime agent runtime으로 이동

OpenAI는 2026년 5월 7일 Realtime API용 새 음성 모델 3종 GPT-Realtime-2, GPT-Realtime-Translate, GPT-Realtime-Whisper를 공개했다. GPT-Realtime-2는 컨텍스트 윈도를 32K에서 128K로 늘리고 병렬 tool call, 조정 가능한 reasoning effort, 더 강한 recovery behavior를…

AI
OpenAI
읽기
2026년 5월 7일

Secret scanning with GitHub MCP Server is now generally available — AI 코딩 보안이 PR 이후 탐지에서 pre-commit agent guardrail로 이동

GitHub는 2026년 5월 5일 GitHub MCP Server의 secret scanning 기능이 general availability에 들어갔다고 발표했다. 이제 MCP 호환 AI 코딩 에이전트와 IDE가 커밋이나 PR 전에 노출된 secret을 직접 스캔할 수 있고, 기존 push protection customization도 그대로 존중한다.

AI
개발도구
읽기
2026년 5월 6일

Gemini API File Search is now multimodal — RAG 경쟁이 text retrieval에서 multimodal evidence layer로 이동

Google은 2026년 5월 5일 Gemini API File Search에 multimodal support, custom metadata, page-level citations를 추가했다. 이제 텍스트와 이미지를 함께 색인·검색할 수 있고, metadata filter로 검색 범위를 줄이며, 응답마다 원문 페이지 단위 citation을 붙여 verifiable RAG를 구성할 수 있다.

AI
Gemini
읽기
2026년 5월 5일

Reduce friction and latency for long-running jobs with Webhooks in Gemini API — agent 런타임의 핵심이 polling이 아니라 event-driven orchestration으로 이동

Google은 2026년 5월 4일 Gemini API에 Webhooks를 도입해 Batch API·Deep Research·장시간 생성 작업의 완료 이벤트를 HTTP POST로 push할 수 있게 했다. 구현은 Standard Webhooks 스펙을 따르며 webhook-signature, webhook-id, webhook-timestamp 기반 서명, 최대 24시간 자동 재시도,…

AI
API
읽기
2026년 5월 1일

Snowflake Intelligence and Cortex Code — enterprise AI control plane 경쟁이 MCP·plugin·cloud agent로 확장

Snowflake는 2026년 4월 21일 Snowflake Intelligence와 Cortex Code 업데이트를 발표하며, enterprise AI의 control plane 포지션을 강화했다. Cortex Code는 AWS Glue·Databricks·Postgres 지원 확대, MCP/ACP 연동, VS Code extension과 Claude Code plugin,…

AI
에이전트
읽기
2026년 5월 1일

The AI engineering stack we built internally — agent 도입 경쟁이 모델 선택에서 사내 infra maturity로 이동

Cloudflare는 2026년 4월 20일 자사 내부 AI engineering stack을 공개하며, 최근 30일 기준 R&D 조직의 93%가 사내 AI 코딩 도구를 사용했고 AI Gateway를 통해 241.37B tokens, Workers AI에서 51.47B input tokens를 처리했다고 밝혔다. 다음 단계로는 MCP portal, git, test runner를 그대로…

AI
개발도구
읽기
2026년 4월 30일

Prepay for the Gemini API to get more control over your spend — 에이전트 경제성이 기능보다 먼저 제품 표면으로 올라오다

Google은 2026년 4월 15일 Google AI Studio용 Gemini API Prepay Billing을 발표했다. 신규 Google Cloud Billing Account를 여는 미국 사용자부터 선불 크레딧 기반 결제를 쓸 수 있고, 자동 충전과 함께 남은 잔액을 기준으로 API 호출 비용을 관리하게 해 spend predictability를 높이겠다는 내용이다.

AI
Gemini
읽기
2026년 4월 20일

Voicebox — 로컬에서 음성 복제·TTS를 다루는 오픈소스 보이스 스튜디오

Voicebox는 음성 복제, 다국어 TTS, 후처리 효과, 멀티 보이스 편집을 한곳에서 다루는 로컬 우선 음성 합성 스튜디오다. 클라우드형 음성 서비스의 대안으로 제시되며, 여러 TTS 엔진을 바꿔가며 테스트하고 REST API로 앱에 붙일 수 있게 설계됐다. 볼 만한 이유는 단순한 모델 데모가 아니라 실제 제작 워크플로우에 가까운 구조를 갖췄기 때문이다. 몇 초짜리 샘플로 보이스…

오픈소스
무료
읽기
2026년 4월 12일

SQL MCP Server 공개 — 데이터베이스 연결이 NL2SQL 실험에서 통제형 agent interface로 이동한다

Microsoft는 2026년 4월 8일 SQL MCP Server를 공개했다. Data API builder 기반의 이 서버는 Microsoft SQL, PostgreSQL, Azure Cosmos DB, MySQL을 지원하며, RBAC·Key Vault·OpenTelemetry·REST/GraphQL/MCP 동시 노출과 함께 AI agent용 고정 DML 도구 집합을 제공한다.

AI
트렌드
읽기
2026년 4월 11일

Azure MCP Server 2.0 stable — MCP가 로컬 개발 편의 기능을 넘어 중앙 통제형 클라우드 운영 인터페이스가 되다

Microsoft는 2026년 4월 10일 Azure MCP Server 2.0 stable을 발표했다. 이번 릴리즈는 57개 Azure 서비스에 걸친 276개 MCP tools를 제공하며, 핵심 변화로 self-hosted remote MCP server, managed identity·OBO 기반 인증, 보안 강화, sovereign cloud 대응을 내세웠다.

AI
트렌드
읽기
2026년 4월 11일

Dataverse Skills 공개 — 엔터프라이즈 로우코드 플랫폼이 이제 '에이전트가 조작 가능한 시스템'이 되기 시작했다

Microsoft는 2026년 4월 1일 Dataverse Skills를 공개했다. GitHub Copilot과 Claude Code용 오픈소스 플러그인으로, Dataverse 환경 탐색, PAC CLI 인증, MCP 등록, 스키마 설계, 데이터 적재, 분석 질의를 자연어 기반 에이전트 루프로 묶는다.

AI
트렌드
읽기
2026년 4월 5일

Google Gemma 4 공개 — Apache 2.0·256K 컨텍스트·멀티모달, 오픈 에이전틱 모델의 새 기준

Google이 4월 2~3일 Gemma 4를 Apache 2.0 라이선스로 공개했다. Effective 2B·4B·26B MoE·31B Dense 네 가지 크기로 제공되며, 256K 토큰 컨텍스트, 비전·오디오 네이티브 멀티모달, 140개 이상 언어를 지원한다.

트렌드
오픈소스
읽기
2026년 4월 5일

Domo AI Agent Builder + MCP Server 공개 — 엔터프라이즈 BI가 멀티-LLM AI 에이전트 인프라로 전환하는 첫 사례

엔터프라이즈 BI 플랫폼 Domo가 AI Agent Builder, AI Toolkits, AI Library, Domo MCP Server로 구성된 AI 오케스트레이션 프레임워크를 발표했다. Domo MCP Server는 Claude, Gemini, ChatGPT 등 외부 AI 플랫폼이 Domo의 데이터·서비스·워크플로우에 MCP 표준으로 직접 접근할 수 있게 한다.

트렌드
AI
읽기
2026년 4월 5일

Model Context Protocol Servers — MCP 레퍼런스 서버 모음

MCP의 공식 레퍼런스 서버 모음. filesystem, fetch, git, memory 같은 예시 서버를 통해 LLM/에이전트가 외부 도구와 안전하게 연결되는 방식을 보여준다.

AI
오픈소스
읽기
2026년 4월 5일

Semantic Kernel — 엔터프라이즈 지향 에이전트 오케스트레이션 SDK

Microsoft의 모델 중립 SDK. agent, multi-agent workflow, plugin, MCP, vector DB를 함께 다루며 .NET/Python/Java를 지원한다.

AI
오픈소스
읽기
2026년 4월 4일

Google Gemini 3.1 Flash Live 공개 — 실시간 음성 에이전트용 오디오 모델, ComplexFuncBench Audio 90.8%

Google은 2026년 3월 26일 Gemini 3.1 Flash Live를 공개하며 실시간 음성 대화용 모델을 Live API preview로 제공하기 시작했다. Google 발표에 따르면 이 모델은 ComplexFuncBench Audio에서 90.8%, Audio MultiChallenge에서 36.1%를 기록하며 다단계 함수 호출과 장기 오디오 추론 성능을 끌어올렸다.

트렌드
API
읽기
2026년 4월 4일

Google Gemini API, Flex & Priority 인퍼런스 티어 도입 — 비용-신뢰성 트레이드오프를 개발자가 제어

Google은 Gemini API에 Flex(비용 50% 절감, 레이턴시 허용)와 Priority(표준 대비 75~100% 프리미엄, 최고 신뢰성) 두 가지 인퍼런스 티어를 추가했다. 기존 배치 API와 달리 Flex는 동기식 인터페이스로 동일 엔드포인트를 그대로 사용한다.

AI
API
읽기
2026년 4월 4일

Google Veo 3.1 Lite 출시 — AI 비디오 생성 비용 50% 절감, 개발자용 고용량 API 제공

Google은 2026년 3월 31일 AI 비디오 생성 모델 Veo 3.1 Lite를 Gemini API와 Google AI Studio를 통해 출시했다. Veo 3.1 Fast 대비 50% 이하 비용으로 동일한 생성 속도를 제공하며, Text-to-Video와 Image-to-Video를 지원한다.

AI
API
읽기
2026년 4월 3일

Arcee Trinity-Large-Thinking 출시 — 미국계 오픈 에이전트 모델이 가격 대비 frontier 경쟁력 제시

Arcee AI가 2026년 4월 1일 Trinity-Large-Thinking을 공개했다. Apache 2.0 오픈웨이트 reasoning 모델로, long-horizon agent와 multi-turn tool calling에 초점을 맞췄고 PinchBench에서 Opus 4.6 바로 아래 2위를 기록했다고 밝혔다.

AI
모델
읽기
2026년 4월 3일

Gemma 4 공개 — Apache 2.0 오픈 모델을 agentic workflow 중심으로 재정의

Google DeepMind가 2026년 4월 2일 Gemma 4를 공개했다. E2B, E4B, 26B MoE, 31B Dense 네 가지 크기로 출시됐고, Apache 2.0 라이선스 아래 reasoning, function calling, JSON output, vision/audio 입력까지 지원한다.

AI
모델
읽기
2026년 4월 3일

GitHub Copilot SDK 공개 프리뷰 — agent runtime이 제품 기능에서 플랫폼 계층으로 확장

GitHub가 2026년 4월 2일 Copilot SDK를 public preview로 공개했다. Copilot cloud agent와 Copilot CLI를 구동하는 동일한 runtime을 Node.js/TypeScript, Python, Go, .NET, Java에서 쓸 수 있게 열어 주고, tool invocation, streaming, multi-turn session,…

AI
개발도구
읽기
2026년 4월 3일

Microsoft, MAI 모델 3종 출시 — Foundry를 독자 멀티모달 모델 유통 채널로 본격 전환

Microsoft가 2026년 4월 2일 MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2를 공개했다. 세 모델은 Microsoft Foundry와 MAI Playground에서 즉시 사용 가능하며, MAI-Transcribe-1은 상위 25개 언어 대상 음성 인식, MAI-Voice-1은 1초에 60초 분량 음성 생성, MAI-Image-2는 Copilot과…

AI
모델
읽기
2026년 4월 2일

Alibaba Qwen3.6-Plus 공개 — 1M 컨텍스트·에이전트 코딩, Claude Opus 4.5 수준 달성

Alibaba가 2026년 4월 2일 Qwen3.6-Plus를 공개했다. 기본 1M 토큰 컨텍스트 윈도우와 멀티모달 네이티브 지원, 리포지토리 수준 코딩 에이전트 기능을 갖췄으며, SWE-bench와 Terminal-Bench 2.0에서 Anthropic Claude Opus 4.5와 동등한 성능을 기록했다.

AI
모델
읽기
2026년 4월 2일

Google Gemini 3.1 Flash-Lite 출시 — Pro 대비 1/8 가격에 Gemini 2.5 Flash 동등 성능

Google이 Gemini 3.1 Flash-Lite를 개발자 프리뷰로 출시했다. 입력 $0.25/1M 토큰(Pro의 1/8 수준), 출력 $1.50/1M 토큰이며, Gemini 2.5 Flash 대비 Time to First Token 2.5배 향상, 출력 속도 45% 향상을 달성하면서 핵심 성능 지표에서는 Gemini 2.5 Flash와 동등하다.

AI
모델
읽기
2026년 4월 1일

NVIDIA Nemotron 3 Super — 120B MoE 오픈소스 에이전트 모델, SWE-Bench 60.5% 달성

NVIDIA가 에이전트 워크로드 특화 오픈소스 모델 Nemotron 3 Super를 공개했다. Mamba-Transformer 하이브리드 MoE 아키텍처로 원래 1,200억 파라미터에서 활성 파라미터 120억만 사용, SWE-Bench Verified 60.47% 및 PinchBench 85.6%로 동급 오픈소스 최고 성능을 기록했다.

트렌드
오픈소스
읽기
2026년 4월 1일

Linux Foundation, MCP 기부 및 AAIF 출범 — AI 에이전트 표준화의 중립 거버넌스 시대 개막

Linux Foundation이 Anthropic의 MCP, Block의 goose, OpenAI의 AGENTS.md를 함칠 에이전틱 AI 파운데이션(AAIF)을 출범했다. AWS, Google, Microsoft, Cloudflare 등이 플래티덧 멤버로 참여하며, MCP는 특정 기업 소유가 아닌 인터넷 인프라 수준의 중립 표준 프로토콜로 전환된다.

트렌드
AI
읽기
2026년 4월 1일

Google TurboQuant — LLM KV 캐시 메모리 6배 압축, H100에서 8배 속도 향상

Google Research가 LLM의 KV 캐시 메모리를 6배 압축하면서 정확도 손실이 없는 알고리즘 TurboQuant를 공개했다. 16비트에서 3비트로의 훈련 없는(training-free) 압축으로 NVIDIA H100에서 최대 8배의 어텐션 연산 속도 향상을 달성하며, ICLR 2026 발표 예정이다.

트렌드
AI
읽기
2026년 4월 1일

GPT-5.4 출시 — 추론·코딩·에이전트 통합 모델, OSWorld-V 인간 기준선 AI 최초 초과

OpenAI가 3월 5일 GPT-5.4를 출시했다. GPT-5.3 Codex의 코딩 역량을 메인라인 추론 모델에 통합한 것으로, 100만 토큰 컨텍스트 윈도우와 멀티스텝 에이전트 워크플로우 자율 실행 능력을 탑재했다. 실제 데스크톱 생산성 태스크를 시뮬레이션하는 OSWorld-V 벤치마크에서 75%를 기록, 인간 기준선(72.4%)을 AI 최초로 초과했다.

AI
모델
읽기
2026년 4월 1일

OpenAI, 최초 오픈웨이트 모델 gpt-oss-120b 공개 — Apache 2.0, o4-mini 수준 추론 성능

OpenAI가 처음으로 오픈웨이트 모델인 gpt-oss-120b(117B 파라미터, MoE)와 gpt-oss-20b를 Apache 2.0 라이선스로 공개했다. 단일 80GB GPU에서 실행 가능하며, 코딩·수학·툴 사용에서 o4-mini와 동등하거나 일부 초과한다.

AI
오픈소스
읽기
2026년 3월 31일

Google TurboQuant — KV 캐시를 3비트로 6배 압축, 재학습 없이 H100에서 8배 처리량

Google의 TurboQuant가 ICLR 2026에서 발표될 예정이다. LLM의 KV 캐시를 3~4비트로 압축해 메모리를 4~6배 절감하면서 정확도 손실이 전혀 없고, H100 GPU에서 32-bit 대비 최대 8배 처리량 향상을 달성한다.

AI
모델
읽기
2026년 3월 31일

Mistral Voxtral TTS — 4B 오픈소스 음성 합성 모델, ElevenLabs 대비 7~9배 저렴

Mistral AI가 3월 26일 오픈소스 텍스트-음성 변환 모델 Voxtral TTS(4B 파라미터)를 출시했다. 9개 언어를 지원하고 5초 이하의 음성 샘플로 목소리를 복제하며, 첫 오디오 출력 지연(TTFA)이 90ms에 불과해 실시간 음성 에이전트 구현이 가능하다.

AI
모델
읽기
2026년 3월 31일

NVIDIA Nemotron 3 Super — 120B Mamba-Transformer MoE 오픈 에이전트 모델, 이전 대비 5배 처리량

NVIDIA가 에이전트 AI 특화 오픈 모델 Nemotron 3 패밀리를 출시했다. 플래그십인 Nemotron 3 Super는 120B 파라미터(활성 12B)의 Mamba-Transformer MoE 하이브리드 아키텍처를 채택해 Nemotron 2 대비 5배 처리량을 달성하고 1M 토큰 컨텍스트 윈도우를 지원한다.

AI
모델
읽기
2026년 3월 31일

Google TurboQuant — LLM KV 캐시 3.5비트 압쳙으로 메모리 6배 절감, 오픈소스 공개

Google이 LLM의 KV-캐시를 채널당 3.5비트로 압쳙하는 오픈소스 양자화 기법 TurboQuant를 공개했다. 메모리 사용량을 최대 6배 줄이고 추론 속도를 대폭 향상시킨다.

AI
모델
읽기
2026년 3월 31일

MCP 9,700만 설치 돌파 — AI 에이전트 인프라 표준으로 안착, 그러나 보안 위협도 급부상

Anthropicの Model Context Protocol(MCP)이 2026년 3월 25일 기준 9,700만 설치를 달성했다. OpenAI, Google DeepMind, Cohere, Mistral 등 주요 AI 제공업체 모두 자사 에이전트 프레임워크에 MCP 지원을 통합 완료했다.

AI
API
읽기
2026년 3월 30일

Mistral Small 4 (22B), 오픈소스 추론 벤치마크 1위 — 자기 3~5배 규모 클로즈드 모델 추월

프랑스 Mistral AI가 공개한 22B 파라미터의 Mistral Small 4가 추론 및 지시 수행 벤치마크에서 자신보다 3~5배 큰 클로즈드 모델들을 앞질렀다. Apache 2.0 라이선스로 제공되며 상업적 이용도 자유롭다.

AI
모델
읽기
2026년 3월 30일

MCP, 월 9700만 다운로드 돌파 — 16개월 만에 React 수준 생태계, AI 에이전트 필수 인프라로 공식화

Model Context Protocol(MCP) SDK의 월간 다운로드가 2026년 3월 기준 9700만 건을 돌파했다. 2024년 11월 Anthropic이 출시했을 당시 약 200만 건이었던 수치가 16개월 만에 4,750% 성장한 것으로, React npm 패키지가 1억 다운로드에 도달하는 데 걸린 3년 대비 절반의 시간이다.

AI
트렌드
읽기
2026년 3월 30일

Mistral Small 4 출시 — 119B MoE (활성 6.5B), Apache 2.0, 추론·멀티모달·코딩 단일 모델 통합

Mistral AI가 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 총 119B 파라미터의 MoE 아키텍처로 활성 파라미터는 6.5B에 불과하지만, 기존에 별도 모델로 운용하던 Magistral(추론), Pixtral(멀티모달), Devstral(에이전트 코딩) 세 가지 역량을 256K 컨텍스트 창 하나로 통합했다.

AI
오픈소스
읽기
2026년 3월 28일

Mistral Small 4 (22B, Apache 2.0): 자신보다 3~5배 큰 클로즈드 모델 추론 성능 압도

Mistral AI가 220억 파라미터 규모의 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 추론 및 지시 수행 벤치마크에서 파라미터 수가 3~5배 많은 클로즈드 모델 여러 개를 상회하는 성능을 보였다.

AI
모델
읽기
2026년 3월 27일

Nvidia GTC 2026: 에이전트 AI 시대 선언 — NemoClaw·Agent Toolkit 오픈소스 공개

Nvidia GTC 2026에서 Jensen Huang은 AI 패러다임이 '프롬프트-응답' 챗봇에서 자율적으로 계획하고 행동하는 에이전트로 전환됐음을 선언했다. 에이전트 보안 레이어 NemoClaw와 오픈소스 에이전트 개발 플랫폼 NVIDIA Agent Toolkit을 공개하며, Salesforce·SAP·Adobe·ServiceNow 등 주요 엔터프라이즈 파트너와의 생태계를 구축했다.

AI
트렌드
읽기
2026년 2월 9일

Claude Opus 4.6 출시 - 1M 토큰 컨텍스트 & Agent Teams

Anthropic의 최신 모델. 1M 토큰 컨텍스트(베타), 128k 토큰 출력, 적응형 사고, 컨텍스트 압축, Agent Teams 기능 추가.

트렌드
API
읽기
2026년 1월 29일

MiniMax Music - AI 음악 생성

MiniMax의 AI 음악 생성 플랫폼. Music 2.0으로 최대 5분 곡 생성, 초실감 보컬, 다중 악기 개별 컨트롤, 영화음악 스코어링 가능. 16개 스타일 × 11개 감정 × 10개 씨나리오. Suno/Udio 경쟁.

트렌드
API
읽기
2026년 1월 29일

Mistral Vibe CLI - 오픈소스 코딩 에이전트

Mistral의 오픈소스(Apache 2.0) CLI 코딩 어시스턴트. Devstral 2(SWE-bench 72.2%) 기반. 터미널에서 자연어로 코드베이스 탐색/수정/실행. 프로젝트 컨텍스트 자동 인식, Git 상태 반영, 멀티파일 오케스트레이션. Claude Sonnet 대비 7배 비용 효율적. 현재 API 무료.

트렌드
오픈소스
읽기
2026년 1월 29일

Hunyuan 3D - Tencent 3D 생성 AI

Tencent의 AI 3D 생성 플랫폼. 텍스트/이미지/스케치로 고품질 3D 에셋 생성. 2단계 DiT 아키텍처(형태→텍스처 분리). 며칠 걸리던 작업을 분 단위로 단축. OBJ/GLB 출력, Unity/Unreal/Blender 호환. HuggingFace 260만+ 다운로드. 무료 20회/일 제공.

트렌드
오픈소스
읽기
2026년 1월 28일

Gemini 3 Flash - Agentic Vision

Google의 Gemini 3 Flash에 추가된 Agentic Vision 기능. 이미지를 단순히 '보는' 게 아니라 Think→Act→Observe 루프로 능동적으로 '조사'함. 코드 실행으로 이미지를 확대/크롭/분석하며 추론 근거를 시각적으로 제시. 비전 벤치마크에서 5-10% 성능 향상. GPQA Diamond 90.4%, SWE-bench 78% 달성.

트렌드
API
읽기
2026년 1월 28일

MiniMax Agent

중국 AI 스타트업 MiniMax의 AI 에이전트. 코딩, 분석, 멀티모달(이미지/영상/음성) 생성 지원. 100만 토큰 컨텍스트의 MiniMax-M1 모델 기반. 자연어로 복잡한 작업 수행 가능.

트렌드
API
읽기
읽을거리로 돌아가기