PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

주제

#트렌드

349개 읽을거리를 모았습니다.
2026년 6월 27일

GPT-5.6 Sol preview - frontier model releases become policy-gated infrastructure decisions

OpenAI는 2026년 6월 26일 GPT-5.6 series의 limited preview를 발표하며 Sol, Terra, Luna 3개 tier와 새로운 max reasoning effort, subagent 기반 ultra mode를 공개했다. Sol은 Terminal-Bench 2.1, GeneBench v1, ExploitBench, ExploitGym 같은 장시간…

AI
OpenAI
읽기
2026년 6월 26일

General Intuition Series A - gameplay data becomes the next action-model training substrate

General Intuition은 Khosla Ventures가 lead한 3억 2천만 달러 Series A를 발표하며, 가상 및 물리 환경에서 perceive, predict, act할 수 있는 모델을 만들겠다고 밝혔다. 보도에 따르면 post-money valuation은 23억 달러이며, TechCrunch는 이번 라운드 이후 누적 공개 funding이 4억 5,400만 달러라고…

AI
산업
읽기
2026년 6월 25일

Claude Tag - Slack-native team agents move from private assistants to shared workspaces

Anthropic은 Slack에서 @Claude를 태그해 팀 단위로 작업을 위임하는 Claude Tag beta를 공개했다. Claude Enterprise와 Team 고객 대상이며, channel-scoped memory, tool/data/codebase access, ambient updates, spend limits, activity logs를 제공한다.

AI
Claude
읽기
2026년 6월 25일

GLM-5.2 - open long-context models push agentic coding toward 1M-token workspaces

Z.AI는 GLM-5.2를 공개하며 1M-token context, flexible effort levels, MIT license, long-horizon coding benchmark 성능을 전면에 내세웠다. 공개 글은 IndexShare로 1M context에서 per-token FLOPs를 2.9x 줄이고, Terminal Bench 2.1 81.0, SWE-bench Pro…

AI
모델
읽기
2026년 6월 24일

FFASR Leaderboard - voice AI benchmarks move from clean speech to far-field reality

Hugging Face와 Treble Technologies는 Far-Field ASR(FFASR) Leaderboard를 공개해 ASR 모델을 reverberation, background noise, competing speech, room acoustics 같은 실제 far-field 조건에서 비교할 수 있게 했다. 기존 clean/near-field benchmark 중심 평가가…

AI
모델
읽기
2026년 6월 24일

Krea 2 technical report - open image models compete on creative control, not only fidelity

Krea는 Krea 2 technical report를 공개하며 K2 Raw와 K2 Turbo 계열의 open-weights text-to-image foundation model을 설명했다. 보고서는 data curation, diffusion transformer architecture, multi-stage training, prompt expander, style-reference…

AI
모델
읽기
2026년 6월 23일

Fika Jobs - AI interview agents expose the product-risk tradeoff in hiring automation

TechCrunch는 Stockholm 기반 Fika Jobs가 AI interview agents와 short-form video profiles를 결합한 hiring platform으로 400만 달러 pre-seed를 유치했다고 보도했다. 후보자는 LinkedIn profile을 연결하고 Gemini 기반 agent가 생성한 약 10분 interview를 수행하며, Fika는 이를 짧은…

AI
에이전트
읽기
2026년 6월 23일

Google Jules evals - coding agents need insight-policy benchmarks, not just SWE-bench tasks

Google Developers Blog는 Jules 연구를 통해 proactive coding agent 평가가 단일 bug fix 성공률이 아니라 insight policy를 측정해야 한다고 주장했다. 내부 Google codebase의 705 bugs와 1,178 CLs를 이용해 related bug cluster를 aspirational goal로 재구성하고, agent가 3회…

AI
개발도구
읽기
2026년 6월 22일

MosaicLeaks - deep research agents can leak private facts through harmless-looking searches

ServiceNow와 Hugging Face는 deep research agent가 private local documents와 web retrieval을 함께 사용할 때 외부 검색 쿼리만으로 민감 정보가 새는 MosaicLeaks 문제를 제시했다. 제안한 PA-DR training은 strict chain success를 48.7%에서 58.7%로 올리면서…

AI
에이전트
읽기
2026년 6월 22일

Reflection-SpaceX compute deal - open-source frontier AI hits a capacity wall

Nvidia-backed Reflection AI가 SpaceXAI의 Colossus 2 compute에 접근하는 대형 계약을 체결한 것으로 보도됐다. 계약 구조는 2026년 7월 1일부터 2029년까지 월 1.5억 달러, 총 약 USD 6.3B 규모로 알려졌고, Reflection은 GB300급 compute를 확보해 open-source frontier model 경쟁을 이어가려 한다.

AI
산업
읽기
2026년 6월 21일

Cloudflare Temporary Accounts — coding agents can deploy Workers without human signup flow

Cloudflare는 2026년 6월 19일 AI agents가 wrangler deploy --temporary로 계정 생성, OAuth, API token 발급 없이 Workers를 배포할 수 있는 Temporary Accounts 기능을 공개했다. 배포된 Worker는 60분 동안 유지되며, 사용자가 claim하면 영구 계정으로 전환할 수 있다.

AI
에이전트
읽기
2026년 6월 21일

GitHub Code Quality GA — code governance becomes subscription plus AI metering

GitHub는 Code Quality가 2026년 7월 20일 public preview에서 GA로 전환되며 유료 제품이 된다고 공지했다. 가격은 enabled repository의 active committer당 월 10달러에 AI-powered 기능 사용량 과금이 추가되고, deterministic CodeQL 분석은 GitHub Actions minutes를 소비한다.

AI
개발도구
읽기
2026년 6월 21일

NVIDIA Cannes AI marketing stack — agentic workflows move into campaign operations

NVIDIA는 Cannes Lions 2026 기간 Alembic, AWS, Criteo, Higgsfield, KERV.ai, Taboola 등이 NVIDIA infrastructure와 agent toolkit으로 광고·마케팅 AI를 운영 사례로 시연한다고 밝혔다. 사례에는 Criteo의 Blackwell 기반 약 2배 학습 속도 개선과 연 17,000 GPU hours 절감,…

AI
산업
읽기
2026년 6월 20일

Adani-Jabil AI infra alliance — AI 경쟁이 모델에서 전력·랙·제조 공급망으로 확장된다

Adani Group과 Jabil은 2026년 6월 15일 India에 vertically integrated AI and data center infrastructure manufacturing platform을 만들기 위한 strategic alliance intent를 발표했다. 목표는 multi-GW high-density AI rack, liquid-cooled server,…

AI
산업
읽기
2026년 6월 20일

JEP 401 Value Classes — Java object model이 identity-free domain value로 이동한다

OpenJDK JEP 401은 Java에 value classes and objects를 preview feature로 도입해, final fields만 갖고 object identity가 없는 domain value 프로그래밍 모델을 제공한다. 최근 Project Valhalla의 JDK 28 target 보도와 함께 Java의 장기 성능 병목인 객체 identity overhead가…

개발도구
트렌드
읽기
2026년 6월 20일

Norway school AI restrictions — 초등 AI 금지가 교육용 AI 확산의 반작용을 보여준다

Reuters 보도에 따르면 Norway는 2026년 8월 새 학기부터 1~7학년(6~13세)의 generative AI 사용을 원칙적으로 금지하고, 14~16세는 교사 감독 아래 제한적으로 허용한다.

AI
트렌드
읽기
2026년 6월 19일

Anthropic Public Record — 미국 대중은 AI 효용보다 책임성과 규제를 먼저 요구한다

Anthropic은 2026년 6월 12일 첫 Anthropic Public Record 결과를 공개했다. 2025년 11~12월 YouGov 기반으로 약 51,993명의 미국인을 조사한 결과, 64%가 AI로 인한 job loss를 우려했고 71%는 정부가 AI 개발·규제에 관여해야 한다고 답했다.

AI
Claude
읽기
2026년 6월 19일

ChatGPT Enterprise spend controls — AI 도입의 병목이 모델 접근에서 비용 거버넌스로 이동

OpenAI는 2026년 6월 18일 ChatGPT Enterprise에 credit usage analytics와 업데이트된 spend controls를 도입해 관리자에게 사용자·제품·모델별 사용량과 비용 가시성을 제공한다고 발표했다.

AI
OpenAI
읽기
2026년 6월 19일

MAI-Code-1-Flash 확장 — coding model 경쟁이 Copilot surface coverage로 이동

GitHub는 2026년 6월 18일 Microsoft의 purpose-built small coding model인 MAI-Code-1-Flash를 Copilot CLI, GitHub Copilot app, GitHub.com Chat, Visual Studio, GitHub Mobile, JetBrains, Eclipse, Xcode 등 더 많은 Copilot surface로 확장한다고…

AI
개발도구
읽기
2026년 6월 19일

OpenAI AI chemist — GPT-5.4가 자동화 실험실과 결합해 Chan-Lam 수율을 개선

OpenAI와 Molecule.one은 2026년 6월 17일 GPT-5.4를 Maria AI/Lab과 연결한 near-autonomous chemistry workflow가 primary sulfonamide Chan-Lam coupling에서 TEMPO 계열 additive를 찾아 수율을 개선했다고 발표했다. Maria Lab은 OAI-M1-03에서 10,080개 반응을 실행했고, 최적…

AI
OpenAI
읽기
2026년 6월 18일

Google UCP open rails — agentic commerce가 쇼핑 UI에서 표준 프로토콜 경쟁으로 이동

Google Open Source Blog는 2026년 6월 16일 Universal Commerce Protocol(UCP)의 agentic commerce 아키텍처를 Open Source Summit North America 맥락에서 정리했다. UCP는 checkout, catalog, cart, orders, identity linking 같은 commerce capability를…

AI
에이전트
읽기
2026년 6월 18일

OpenAI June 2026 Threat Report — AI 논쟁 자체가 영향공작 표적이 됐다

OpenAI의 June 2026 Threat Report는 PRC-linked influence operation이 미국 내 AI debate, 특히 data center와 AI infrastructure 논쟁을 겨냥한 사례를 다뤘다. OpenAI는 악성 사용을 탐지·차단하고 보고하는 과정에서 threat actor가 웹사이트, 소셜 계정, 여러 AI model을 함께 쓰는 다중 플랫폼…

AI
OpenAI
읽기
2026년 6월 18일

Probably $9M seed — AI 신뢰성 경쟁이 더 큰 모델에서 deterministic harness engineering으로 이동

TechCrunch는 2026년 6월 16일 Probably가 Andreessen Horowitz로부터 900만 달러 seed funding을 유치했다고 보도했다. Probably는 데이터 분석 답변을 생성한 뒤 deterministic validator가 결과를 검증하고 audit trail과 citation을 제공하는 방식으로 AI hallucination을 줄이려 한다.

AI
트렌드
읽기
2026년 6월 12일

Prometheus $12B Series B — industrial AI가 chatbot에서 physical engineering cycle compression으로 이동

Axios는 2026년 6월 11일 Jeff Bezos와 전 Google 임원 Vik Bajaj가 이끄는 Prometheus가 120억 달러 Series B를 조달해 410억 달러 valuation에 도달했다고 보도했다. 회사는 jet engine, medical device, consumer electronics 같은 물리 제품의 설계·제조 준비 주기를 10배 이상 단축할 수 있는…

AI
산업
읽기
2026년 6월 11일

AI brands as bait — AI 열풍이 모델 출시 경쟁에서 social engineering 공격면 확대로 번지다

Microsoft Threat Intelligence는 2026년 6월 8일, ChatGPT·Claude·DeepSeek·Microsoft Copilot 같은 유명 AI 브랜드를 미끼로 한 phishing·malvertising·SEO 유도 공격이 최근 수개월간 증가했다고 공개했다. 예시로 ChatGPT Plus 결제 갱신 사칭 캠페인, 2,000개 이상 조직을 겨냥한…

AI
트렌드
읽기
2026년 6월 10일

AI in the Enterprise: How People Use M365 Copilot Chat — enterprise AI 채택이 검색 보조에서 문서·커뮤니케이션 작업으로 이동

Microsoft 연구진은 2026년 5월 11일 공개한 논문에서 M365 Copilot Chat 약 550만 세션을 분석해, 이 도구가 백만 개 이상 기업에서 주간 단위로 사용되고 있다고 설명했다. 분석 결과 writing이 가장 큰 비중을 차지했고, 사용 패턴은 단순 정보 검색보다 content creation과 communication 중심으로 이동하는 추세를 보였다.

AI
트렌드
읽기
2026년 6월 10일

OpenRouter·Concentrate AI 부상 — LLM 경쟁이 모델 성능에서 routing economics 계층으로 이동

Business Insider는 2026년 6월 10일 OpenRouter가 최근 1억1300만 달러를 조달해 13억 달러 valuation을 받았고, Concentrate AI도 500만 달러 이상을 확보하며 스텔스에서 나왔다고 보도했다. 두 회사는 400개 이상 모델을 대상으로 비용, 가용성, 성능을 비교해 워크로드를 라우팅하는 계층을 전면에 내세우고 있다.

AI
산업
읽기
2026년 6월 8일

Dreaming: Better memory for a more helpful ChatGPT — AI personal memory가 saved note에서 지속적 user model로 전환

OpenAI는 2026년 6월 4일 ChatGPT memory를 dreaming 기반의 새 아키텍처로 업그레이드한다고 발표했다. 새 시스템은 background synthesis로 여러 대화에서 memory를 통합해 freshness·continuity·relevance를 높이며, 미국의 Plus·Pro 사용자에게 먼저 배포된다.

AI
OpenAI
읽기
2026년 6월 8일

ECB AI risk letter — 금융권 AI 도입이 pilot enthusiasm에서 board-level defensive posture로 이동

Reuters에 따르면 ECB는 2026년 6월 3일 commercial bank들에 최신 AI model이 초래할 수 있는 공격 위험에 대응하기 위한 targeted measures를 요구할 계획이라고 밝혔다. ECB는 dear CEO letter를 보내 proactive defence와 개별 은행 후속 점검에 나설 예정이다.

AI
트렌드
읽기
2026년 6월 8일

US House AI draft bill — 미국 AI 규제 경쟁이 state patchwork에서 federal model-development preemption으로 이동

Reuters에 따르면 미국 하원 초당파 의원들은 2026년 6월 4일 states가 AI model development 자체를 규제하지 못하게 하는 초안 법안을 공개했다. 초안은 모델 출시 전 테스트 의무 같은 state-level rule은 막되, AI 활용 방식에 대한 state regulation은 허용하는 구조다.

AI
트렌드
읽기
2026년 6월 6일

Protecting against token theft — AI endpoint 보안이 인증에서 per-request 경제성 방어로 이동

Vercel은 2026년 5월 29일 AI endpoint를 노린 token theft 공격 패턴과 대응 방식을 공개했다. 회사에 따르면 4월 12일 자사 docs AI chat endpoint는 Anthropic Claude Haiku 4.5 기반 트래픽이 평시 대비 약 10배까지 급증했고, 분당 1,300 요청 수준이면 일간 1만 달러 이상 inference 비용으로 이어질 수 있었다.

AI
개발도구
읽기
2026년 6월 4일

Palo Alto Frontier AI Defense — AI 보안이 모델 평가에서 machine-speed 대응 체계로 이동

Palo Alto Networks는 2026년 5월 7일 Frontier AI Defense를 발표하며, 최신 frontier model이 이전 세대 대비 약 50% 높은 coding efficiency를 보이고 AI-assisted 공격에서 initial access부터 exfiltration까지 시간이 25분 수준으로 줄 수 있다고 밝혔다. 이에 대응해 자사는 early model…

AI
산업
읽기
2026년 6월 4일

SAP sustainability AI agents — enterprise AI가 챗봇에서 규제 워크플로 자동화로 이동

SAP는 2026년 5월 15일 SAP Sapphire에서 sustainability AI agents를 발표했고, 2026년 말까지 일반 제공을 목표로 한다고 밝혔다. SAP에 따르면 이 agents는 packaging compliance review 시간을 50% 이상 줄이고, scenario simulation 시간을 하루에서 20분으로 단축하며, GHS classification…

AI
산업
읽기
2026년 6월 3일

Coralogix 200M Series F: AI agent observability가 독립 인프라 카테고리로 부상

Coralogix는 2026년 6월 3일 보도 기준 Series F로 2억 달러를 조달했고, post-money valuation은 16억 달러로 제시됐다. 이번 투자는 AI agent 확산으로 인해 autonomous software를 모니터링·트러블슈팅·관리하는 observability layer 수요가 커질 것이라는 베팅 위에서 이뤄졌다.

AI
산업
읽기
2026년 6월 3일

Postman AI Engineer: API 조직이 context debt를 관리하는 agentic engineering 계층

Postman은 2026년 6월 2일 AI Engineer를 발표했다. 이 제품은 Context Graph를 기반으로 API, 서비스, 의존성 지형을 지속적으로 맵핑하고, secure sandbox에서 repo pull, bash 실행, UI test, PR QA까지 수행하며 undocumented API 탐색, system design review, root cause analysis,…

AI
개발도구
읽기
2026년 6월 2일

Build 2026: Microsoft가 Windows를 local agent runtime으로 전환

Microsoft는 2026년 6월 2일 Build 2026에서 Windows 개발 플랫폼 업데이트를 발표하며 Aion 1.0 Instruct와 Aion 1.0 Plan을 공개했다. 특히 Aion 1.0 Plan은 14B 규모, 32K context의 reasoning·tool-calling 모델로, capable device에서 Windows에 in-box로 탑재돼 로컬에서 파일 관리와…

AI
개발도구
읽기
2026년 6월 2일

Codex for every role, tool, and workflow — 코딩 에이전트가 팀 업무 플랫폼으로 확장

OpenAI는 2026년 6월 2일 Codex용 role-specific plugins, annotations, Sites preview를 발표했다. 회사는 Codex 주간 사용자가 500만 명을 넘었고, 비개발자 사용자가 전체의 약 20%이며 개발자보다 3배 이상 빠르게 늘고 있다고 밝혔다.

AI
OpenAI
읽기
2026년 6월 2일

미국 AI 행정명령: frontier model 정책이 보안 운영 체계로 구체화

백악관은 2026년 6월 2일 'Promoting Advanced Artificial Intelligence Innovation and Security' 행정명령을 발표했다. 명령은 30일 안에 연방 시스템의 AI 기반 방어 우선순위를 높이고, AI 업계와 중요 인프라 운영자가 함께 참여하는 cybersecurity clearinghouse를 구성하며, 60일 안에 covered…

AI
트렌드
읽기
2026년 6월 1일

Salesforce acquires Contentful — enterprise AI가 CRM assistant에서 content orchestration layer 통합으로 이동

Salesforce는 2026년 6월 1일 Contentful 인수 계약 체결을 발표했다. 회사는 Data 360, Agentforce, Contentful의 composable API를 결합해 Customer 360 전반에 native content layer를 넣고, 채널별로 다른 정적 콘텐츠를 AI가 조합하는 구조로 전환하겠다고 밝혔다.

AI
산업
읽기
2026년 5월 31일

AWS launches Amazon Quick desktop AI assistant that works across your applications, tools, and data

Amazon은 2026년 5월 27일 Amazon Quick의 데스크톱 앱을 공개했다. Quick은 로컬 파일, 캘린더, 이메일, 브라우저 기반 업무 도구를 백그라운드에서 연결하고, 개인 knowledge graph와 장기 메모리를 바탕으로 문서·대시보드·프레젠테이션 생성과 cross-app workflow 자동화를 수행한다.

AI
트렌드
읽기
2026년 5월 31일

Enhanced AI Management and Analytics for Organizations

JetBrains는 2026년 2월 12일 JetBrains Console을 공개하며 조직 단위 AI 관리·관측 기능을 발표했다. 관리자는 팀별 AI 활성화, Claude Agent·OpenAI Codex·Junie 접근 제어, AI Credit 풀·개별 한도, 데이터 수집 옵션, 활성 사용자와 코드 수용률 같은 사용 지표를 중앙에서 관리할 수 있다.

AI
개발도구
읽기
2026년 5월 30일

AI coding startup Cognition raises $1B at $25B pre-money valuation — 코딩 에이전트 경쟁이 데모 품질에서 revenue proof와 orchestration economics로 이동

Cognition은 2026년 5월 27일 10억 달러 이상을 조달하며 pre-money 기준 250억 달러, post-money 기준 260억 달러 가치평가를 받았다. TechCrunch 보도에 따르면 Devin의 enterprise 사용 확대와 함께 annualized revenue run-rate는 4억9200만 달러에 도달했고, 최근 6개월간 월별 성장률은 50% 수준이라고 밝혔다.

AI
개발도구
읽기
2026년 5월 30일

AI Now Summit 2026 — 산업용 AI 경쟁이 범용 assistant에서 domain-specific engineering stack으로 이동

Mistral은 2026년 5월 28일 AI Now Summit에서 Airbus, BMW Group, ASML 사례를 공개하며 industrial engineering용 AI stack을 전면에 내세웠다. Airbus에는 설계부터 onboard capability까지 AI를 넣고, BMW의 LIM initiative에는 engineering data 기반 multimodal…

AI
산업
읽기
2026년 5월 30일

NVIDIA and IREN Announce Strategic Partnership to Accelerate Deployment of up to 5 Gigawatts of AI Infrastructure — AI infra 경쟁이 GPU 조달에서 전력·부지 결합형 factory rollout으로 이동

NVIDIA와 IREN은 2026년 5월 7일 최대 5GW 규모의 NVIDIA DSX-aligned AI infrastructure 배치를 목표로 하는 전략적 파트너십을 발표했다. Sweetwater, Texas의 2GW 캠퍼스를 핵심 거점으로 삼고, NVIDIA는 최대 3천만 주를 주당 70달러에 매입할 수 있는 5년 권리를 받아 조건부로 최대 21억 달러를 투자할 수 있게 됐다.

AI
산업
읽기
2026년 5월 27일

EY and Microsoft launch a $1B enterprise AI initiative — enterprise AI 경쟁이 PoC에서 field engineering 운영으로 이동

EY와 Microsoft는 2026년 5월 22일 향후 5년간 10억 달러 이상을 공동 투자하는 글로벌 enterprise AI initiative를 발표했다. Microsoft의 Forward Deployed Engineers와 EY 산업 전문가가 통합 팀을 구성해 고객사의 핵심 업무에 AI를 대규모 배치하고, EY 내부에서는 Copilot을 15만 명에게 먼저 배포해 15% 생산성…

AI
산업
읽기
2026년 5월 27일

Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs — agent 인프라 경쟁이 GPU 단독에서 CPU 설계로 확장

NVIDIA는 2026년 5월 18일 자사 첫 custom CPU인 Vera를 Anthropic, OpenAI, SpaceXAI, Oracle Cloud Infrastructure에 인도했다고 발표했다. Vera는 88개의 Olympus 코어, 1.2TB/s 메모리 대역폭, 기존 설계 대비 50% 빠른 per-core 성능을 내세우며, agent orchestration·tool…

AI
산업
읽기
2026년 5월 26일

EU agrees AI Act simplification package — AI 규제 경쟁의 초점이 금지 강화보다 시행 부담 재설계로 이동

EU Council과 European Parliament negotiators는 2026년 5월 7일 AI 규칙 단순화에 대한 잠정 합의에 도달했고, 관련 공지는 5월 18일 보강 업데이트됐다. 합의안은 high-risk AI 규정 적용 시점을 standalone 시스템은 2027년 12월 2일, 제품 내장형 시스템은 2028년 8월 2일로 늦추는 한편, 투명성 솔루션 적용 유예는…

AI
산업
읽기
2026년 5월 26일

GPT-5.3-Codex becomes Copilot’s base model — 엔터프라이즈 AI 코딩 도입의 핵심이 모델 성능보다 변경 통제와 LTS 거버넌스로 이동

GitHub는 2026년 5월 17일 GPT-5.3-Codex를 Copilot Business·Enterprise의 기본 모델로 전환했다. 이 모델은 2026년 2월 5일 출시됐고 2027년 2월 4일까지 12개월 LTS가 보장되며, 기본 승인 모델로 쓰일 때 GPT-4.1을 대체하고 1x premium request multiplier가 적용된다.

AI
개발도구
읽기
2026년 5월 25일

Building for the Intelligence System on Android — Android가 앱을 호출하는 방식이 UI 중심에서 agent-callable capability로 이동

Google은 2026년 5월 12일 Android를 단순 OS가 아니라 “intelligence system”으로 재정의하고, Gemini Intelligence와 AppFunctions를 통해 앱의 기능을 OS와 에이전트가 직접 호출할 수 있는 경로를 공개했다. 초기 private preview에서는 KakaoTalk 같은 앱이 메시지 전송과 음성 통화 같은 기능을 자연어 기반…

AI
Gemini
읽기
2026년 5월 25일

Google-Blackstone AI cloud venture — AI 인프라 경쟁이 모델 판매에서 전력·TPU 수용력 패키징으로 이동

Reuters는 2026년 5월 18일 Google과 Blackstone이 AI cloud venture를 출범시킨다고 보도했다. Blackstone은 초기 equity 50억 달러를 투입해 2027년까지 500MW 데이터센터 용량을 올리고, 이 벤처는 Google TPU와 데이터센터 수용력을 묶어 compute-as-a-service 형태로 제공할 예정이다. 총 투자 규모는 차입을 포함해…

AI
산업
읽기
2026년 5월 25일

Project Glasswing: An initial update — AI 보안 경쟁의 병목이 취약점 탐지에서 triage·patch 운영으로 이동

Anthropic은 2026년 5월 22일 Project Glasswing의 첫 업데이트를 공개하며, Mythos Preview와 약 50개 파트너가 한 달 만에 1만 건이 넘는 high/critical 취약점을 찾았다고 밝혔다. 오픈소스 프로젝트 1,000개 이상을 스캔해 총 23,019건의 취약점을 탐지했고, 그중 고위험으로 추정한 1,752건을 외부 보안 연구진이 검증한 결과…

AI
Claude
읽기
2026년 5월 25일

PyTorch 2.12 Release — 모델 프레임워크 경쟁이 연구 편의성에서 하드웨어 중립 배포와 추론 효율로 이동

PyTorch Foundation은 2026년 5월 13일 PyTorch 2.12를 공개했다. 이번 릴리스는 CUDA에서 batched linalg.eigh 최대 100배 가속, torch.accelerator.Graph를 통한 CUDA/XPU 공통 graph capture API, torch.export의 Microscaling quantization 포맷 지원, torch.cond의…

AI
개발도구
읽기
2026년 5월 24일

California signs AI disruption executive order — AI 경쟁이 모델 정책을 넘어 노동시장 운영체계로 번진다

California 주정부는 2026년 5월 21일 AI로 인한 노동시장 충격에 대비하는 행정명령을 발표했다. 이 명령은 180일 내 WARN Act 개정 권고, AI 영향 대시보드, 조기 경보 지표, 직무 전환 지원, 소기업 교육·인센티브, worker ownership 모델 검토 등을 포함한다.

AI
트렌드
읽기
2026년 5월 23일

Honeycomb Agent Observability — 에이전트 운영 경쟁이 프롬프트 품질에서 trace 재구성과 조사 자동화로 이동

Honeycomb는 2026년 5월 12일 Agent Timeline, Canvas Agent, Canvas Skills를 포함한 Agent Observability 기능군을 공개했다. 이 기능은 LLM call, tool invocation, agent handoff, downstream system impact를 하나의 production observability layer에서…

AI
에이전트
읽기
2026년 5월 20일

Advancing content provenance for a safer, more transparent AI ecosystem — AI 생성물 경쟁이 품질에서 검증 가능성으로 확장

OpenAI는 2026년 5월 19일 C2PA conformant generator product 전환, Google SynthID 기반 이미지 watermark 도입, 그리고 공개 검증 도구 preview를 포함한 content provenance 강화 계획을 발표했다. SynthID는 ChatGPT, Codex, OpenAI API를 통해 생성된 이미지에 적용되며, 검증 도구는…

AI
OpenAI
읽기
2026년 5월 20일

NVIDIA-Verified Agent Skills Provide Capability Governance for AI Agents — agent 확장성 경쟁이 capability supply chain 검증으로 이동

NVIDIA는 2026년 5월 19일 agent skill에 transparency, security scanning, cryptographic signing, machine-readable skill card를 부여하는 NVIDIA-Verified Skills 체계를 공개했다. 검증된 skill은 cataloging, review, SkillSpector 스캔, signing,…

AI
에이전트
읽기
2026년 5월 19일

Gemini 3.5 Flash — Google이 agentic coding의 기본 축을 모델+하네스 결합으로 재정의

Google은 2026년 5월 19일 Gemini 3.5 Flash를 공개하며 Gemini app, AI Mode in Search, Google Antigravity, Gemini API, Android Studio, Gemini Enterprise Agent Platform 전반에 즉시 배포했다. Google은 이 모델이 Terminal-Bench 2.1 76.2%, GDPval-AA…

AI
Gemini
읽기
2026년 5월 18일

Hermes Unlocks Self-Improving AI Agents, Powered by NVIDIA RTX PCs and DGX Spark — 로컬 에이전트 경쟁이 모델보다 orchestration 설계로 이동

NVIDIA는 2026년 5월 13일 Nous Research의 오픈소스 Hermes Agent를 소개하며, 이 프레임워크가 3개월도 안 돼 GitHub star 14만 개를 넘겼고 OpenRouter 기준 가장 많이 쓰이는 agent라고 설명했다. Hermes는 self-evolving skills, contained sub-agents, curated reliability를 내세우며…

AI
오픈소스
읽기
2026년 5월 17일

Local open models on laptops — 오픈모델 성능 향상이 하드웨어보다 아키텍처 혁신에 더 크게 의존하기 시작

Hugging Face 커뮤니티 글은 2026년 5월 11일, 128GB MacBook Pro 기준 로컬에서 구동 가능한 최상위 오픈웨이트 모델의 성능이 2년 사이 Artificial Analysis Intelligence Index 10 → 47로 상승했다고 정리했다. 같은 기간 RAM 상한은 128GB로 거의 고정됐고, 향상의 핵심 동인은 sparse MoE, mixed…

AI
오픈소스
읽기
2026년 5월 16일

AI sovereignty on AWS — sovereign AI의 핵심이 모델 선택보다 통제 가능한 배치 옵션으로 이동

AWS는 2026년 5월 12일 AI sovereignty를 위한 인프라·정책 프레임을 공개하며, AI Factories, Outposts, Local Zones, European Sovereign Cloud, Bedrock의 private fine-tuning 옵션 등을 묶어 제시했다. AWS는 Bedrock 입력·출력이 Amazon Nova나 third-party model 학습에…

AI
산업
읽기
2026년 5월 15일

Gemini in Chrome on Android — 모바일 브라우저가 읽기 도구에서 실행형 agent surface로 전환

Google은 2026년 5월 12일 Gemini in Chrome과 auto browse를 Android에 도입한다고 발표했다. Gemini 3.1 기반으로 현재 페이지를 이해해 요약·질문 응답·Google 앱 연동을 수행하고, auto browse는 SpotHero 주차 예약이나 Chewy 주문 변경 같은 웹 기반 작업을 반자동으로 실행하며 민감한 작업 전에는 사용자 확인을 요구한다.

AI
Gemini
읽기
2026년 5월 13일

Your car with Google built-in is about to get smarter, thanks to Gemini — Gemini 확장이 앱을 넘어 내장형 OS와 EV UX로 들어간다

Google은 2026년 4월 30일 공식 블로그에서 Gemini가 cars with Google built-in에 롤아웃되며 Google Assistant를 대체한다고 밝혔다. 자연어 기반 내비게이션, 메시지 요약/응답, 차량 설명서 기반 질의응답, EV 배터리·충전 맥락 질의, Gemini Live 기반 브레인스토밍까지 포함되며, 신규 차량뿐 아니라 기존 차량에도 software…

AI
Gemini
읽기
2026년 5월 11일

Databricks Unity AI Gateway — 에이전트·LLM·MCP를 하나의 거버넌스 계층으로 묶는 플랫폼화

Databricks는 2026년 5월 6~7일 기준 문서 업데이트를 통해 Unity AI Gateway와 새 agent/MCP 문서를 전면 공개했다. 이 Beta 계층은 LLM endpoint, coding agent, MCP server를 하나의 control plane에서 관리하고, multi-agent orchestration 템플릿은 OpenAI Agents SDK 기반으로…

AI
에이전트
읽기
2026년 5월 11일

EMO — MoE가 실제 배포 가능한 모듈형 모델로 진화할 수 있음을 보여준 AllenAI의 오픈 릴리즈

AllenAI는 2026년 5월 8일 EMO를 공개했다. 이 모델은 1B active / 14B total parameter, 128 experts, 1T tokens 규모의 MoE를 문서 단위 shared expert pool 제약으로 학습해, 전체 expert의 12.5%만 사용해도 near full-model 성능을 유지하도록 설계됐다.

AI
모델
읽기
2026년 5월 11일

IBM Think 2026 — agent 도입 경쟁이 보조 코파일럿에서 control plane과 SDLC 운영체계로 이동

IBM은 2026년 5월 5일 Think 2026에서 IBM Bob SaaS, watsonx Orchestrate 기반 agentic control plane, watsonx.data MCP server integration, OpenRAG, DataPower Interact Gateway 등을 한꺼번에 발표했다. 포인트는 개별 모델 발표보다, SDLC·데이터·보안·운영 계층 전체를…

AI
에이전트
읽기
2026년 5월 11일

Stable Animation SDK — 생성형 이미지 모델 경쟁이 정적 이미지에서 프로그래머블 모션 파이프라인으로 확장

Stability AI는 2026년 5월 11일 Stable Animation SDK를 발표했다. 이 SDK는 Stability의 animation endpoint를 통해 text-to-animation, image+text-to-animation, video+text-to-animation 세 경로를 제공하며, Stable Diffusion 2.0과 SDXL 계열 모델을 개발자용…

AI
API
읽기
2026년 5월 10일

Cursor 3.3 PR Review, Build in Parallel, and Split PRs — 코딩 에이전트 경쟁이 코드 생성에서 리뷰·병렬 실행 워크플로로 확장

Cursor는 2026년 5월 7일 Cursor 3.3에서 PR Review, Build in Parallel, Split PRs를 공개했다. 새 PR review UI는 review thread·top-level comment·commit history·changes tree를 한 화면에 모으고, Build in Parallel은 plan의 독립 작업을 비동기 subagent로 병렬…

AI
개발도구
읽기
2026년 5월 10일

Introducing agent quality optimization in AgentCore, now in preview — agent 운영의 병목이 프롬프트 수정이 아니라 trace 기반 품질 피드백 루프로 이동

AWS는 2026년 5월 4일 AgentCore의 agent quality optimization preview를 발표했다. 이 기능은 production trace를 기반으로 개선 권고를 생성하고, batch evaluation과 A/B testing으로 검증한 뒤 배포까지 이어지는 품질 개선 루프를 AgentCore 안에서 다루도록 설계됐다.

AI
에이전트
읽기
2026년 5월 10일

Microsoft Agent 365 now generally available — enterprise agent 도입의 초점이 개별 배포보다 조직 단위 관제·거버넌스로 이동

Microsoft는 2026년 5월 7일 Microsoft Agent 365의 general availability를 발표했다. Agent 365는 조직 전반의 AI agent를 관측·관리·보호하는 control plane으로, Defender·Intune 기반 shadow AI 탐지, unmanaged agent 차단, Entra network controls, AWS·Google 연동…

AI
에이전트
읽기
2026년 5월 9일

Higher usage limits for Claude and a compute deal with SpaceX — AI 제품 경쟁의 병목이 모델 품질에서 compute allocation과 요금제 운영으로 이동

Anthropic은 2026년 5월 6일 Claude Code와 Claude API의 사용 한도를 상향한다고 발표했다. Pro·Max·Team·seat-based Enterprise의 5시간 한도를 2배로 늘리고, Pro·Max의 피크 시간대 제한을 없앴으며, 동시에 SpaceX Colossus 1 데이터센터의 전체 compute capacity를 확보해 300MW 이상, 22만 개가 넘는…

AI
Claude
읽기
2026년 5월 9일

More flexible secrets and variables for Copilot cloud agent — 코딩 에이전트 운영의 핵심이 repo별 설정에서 조직 공통 control plane으로 이동

GitHub는 2026년 5월 8일 Copilot cloud agent 전용 Agents secrets and variables를 출시했다. 이제 background development environment에서 동작하는 cloud agent에 필요한 secret과 variable을 repository별 copilot environment에 따로 넣지 않고, 조직 수준에서 공유·제어할 수…

AI
개발도구
읽기
2026년 5월 8일

Better customer experiences. Built on Sierra — AI 에이전트 자금이 모델 실험보다 운영 성과형 워크플로로 몰리는 신호

Sierra는 2026년 5월 4일 Tiger Global과 GV 주도로 9억5천만 달러를 조달했고 기업가치는 150억 달러를 넘었다고 밝혔다. 회사는 현재 40% 이상의 Fortune 50을 고객으로 확보했으며, 자사 플랫폼 위 agent가 refinance, claims processing, returns, fundraising 등에서 수십억 건의 customer interaction을…

AI
에이전트
읽기
2026년 5월 8일

Modernize your workflows: Amazon WorkSpaces now gives AI agents their own desktop (preview) — 레거시 앱이 API 없이도 에이전트 대상이 되는 전환점

AWS는 2026년 5월 5일 Amazon WorkSpaces가 AI agent 전용 desktop access를 public preview로 지원한다고 발표했다. agent는 기존 WorkSpaces 환경 안에서 IAM 인증, CloudTrail·CloudWatch audit, MCP endpoint, computer input과 computer vision 기능을 사용해 데스크톱 앱을…

AI
에이전트
읽기
2026년 5월 7일

Advancing voice intelligence with new models in the API — voice AI 경쟁이 STT/TTS를 넘어 realtime agent runtime으로 이동

OpenAI는 2026년 5월 7일 Realtime API용 새 음성 모델 3종 GPT-Realtime-2, GPT-Realtime-Translate, GPT-Realtime-Whisper를 공개했다. GPT-Realtime-2는 컨텍스트 윈도를 32K에서 128K로 늘리고 병렬 tool call, 조정 가능한 reasoning effort, 더 강한 recovery behavior를…

AI
OpenAI
읽기
2026년 5월 7일

CAISI Signs Agreements Regarding Frontier AI National Security Testing — frontier AI 거버넌스가 사후 규제보다 사전 평가 체계로 이동

미국 NIST 산하 CAISI는 2026년 5월 5일 Google DeepMind, Microsoft, xAI와 frontier AI 국가안보 테스트 협약을 체결했다고 발표했다. 이 협약에 따라 CAISI는 공개 전 모델 평가, 배포 후 평가, 표적 연구를 수행하며, 현재까지 40건 이상 평가를 완료했다고 밝혔다.

AI
산업
읽기
2026년 5월 7일

Enterprise-managed plugins in GitHub Copilot CLI are now in public preview — 코딩 에이전트 도입이 개인 설정에서 중앙 통제형 배포로 이동

GitHub는 2026년 5월 6일 Enterprise-managed plugins가 GitHub Copilot CLI에서 public preview에 들어갔다고 발표했다. 관리자는 .github-private/.github/copilot/settings.json을 통해 플러그인 마켓플레이스, 자동 설치 플러그인, 항상 활성화할 hooks와 MCP 구성을 중앙에서 배포할 수 있다.

AI
에이전트
읽기
2026년 5월 7일

Secret scanning with GitHub MCP Server is now generally available — AI 코딩 보안이 PR 이후 탐지에서 pre-commit agent guardrail로 이동

GitHub는 2026년 5월 5일 GitHub MCP Server의 secret scanning 기능이 general availability에 들어갔다고 발표했다. 이제 MCP 호환 AI 코딩 에이전트와 IDE가 커밋이나 PR 전에 노출된 secret을 직접 스캔할 수 있고, 기존 push protection customization도 그대로 존중한다.

AI
개발도구
읽기
2026년 5월 6일

Gemini API File Search is now multimodal — RAG 경쟁이 text retrieval에서 multimodal evidence layer로 이동

Google은 2026년 5월 5일 Gemini API File Search에 multimodal support, custom metadata, page-level citations를 추가했다. 이제 텍스트와 이미지를 함께 색인·검색할 수 있고, metadata filter로 검색 범위를 줄이며, 응답마다 원문 페이지 단위 citation을 붙여 verifiable RAG를 구성할 수 있다.

AI
Gemini
읽기
2026년 5월 6일

GPT-5.5 Instant — 범용 AI 제품 경쟁이 frontier launch보다 기본 모델 운영 품질로 이동

OpenAI는 2026년 5월 5일 ChatGPT의 기본 모델을 GPT-5.5 Instant로 교체한다고 발표했다. 새 모델은 GPT-5.3 Instant 대비 고위험 프롬프트에서 hallucinated claim을 52.5% 줄였고, 사용자가 오류를 지적했던 까다로운 대화에서는 inaccurate claim을 37.3% 줄였으며, chat-latest로도 제공된다.

AI
OpenAI
읽기
2026년 5월 6일

NVIDIA extreme co-design — agent 인프라 경쟁이 모델 FLOPs보다 token economics 최적화로 이동

NVIDIA는 2026년 5월 5일 agentic workload의 토큰 경제성을 분석하며, Claude Code 세션 예시에서 33분 동안 283개 inference request, 225개 sub-agent invocation, 15K→156K token context 성장 후 20K로 compaction 되는 패턴을 공개했다. 회사는 이를 해결하기 위해 Vera Rubin NVL72,…

AI
에이전트
읽기
2026년 5월 5일

Accelerating Gemma 4: faster inference with multi-token prediction drafters — 오픈모델 경쟁의 기준이 benchmark보다 latency economics로 이동

Google은 2026년 5월 5일 Gemma 4용 Multi-Token Prediction (MTP) drafters를 공개했다. 이 speculative decoding 구조는 Gemma 4 target model과 경량 drafter를 결합해 output 품질 저하 없이 최대 3배 속도 향상을 제공하며, Gemma 4는 출시 수주 만에 6천만 다운로드를 넘겼다고 밝혔다.

AI
오픈소스
읽기
2026년 5월 5일

Advancing AI evaluation with the Center for AI Standards and Innovation and the AI Security Institute — frontier AI 경쟁이 capability race에서 평가 인프라 경쟁으로 확장

Microsoft는 2026년 5월 5일 미국 CAISI와 영국 AISI와의 신규 협력을 발표하며 frontier model 테스트, safeguard 평가, 국가안보·대규모 공공안전 리스크 완화 연구를 공동으로 진행하겠다고 밝혔다. 미국 측에서는 NIST와 adversarial assessment 방법론, 공유 프레임워크·데이터셋·workflow를 개발하고, 영국 측에서는…

AI
산업
읽기
2026년 5월 5일

Reduce friction and latency for long-running jobs with Webhooks in Gemini API — agent 런타임의 핵심이 polling이 아니라 event-driven orchestration으로 이동

Google은 2026년 5월 4일 Gemini API에 Webhooks를 도입해 Batch API·Deep Research·장시간 생성 작업의 완료 이벤트를 HTTP POST로 push할 수 있게 했다. 구현은 Standard Webhooks 스펙을 따르며 webhook-signature, webhook-id, webhook-timestamp 기반 서명, 최대 24시간 자동 재시도,…

AI
API
읽기
2026년 5월 4일

Building a new enterprise AI services company with Blackstone, Hellman & Friedman, and Goldman Sachs

Anthropic은 2026년 5월 4일 Blackstone, Hellman & Friedman, Goldman Sachs와 함께 중견기업 대상의 새 enterprise AI services 회사를 만든다고 발표했다. 이 조직은 Anthropic Applied AI 인력과 현장 엔지니어링 팀을 결합해 Claude 기반 업무 시스템을 설계·구축·운영하는 delivery layer 역할을…

AI
Claude
읽기
2026년 5월 4일

From capability to responsibility: Securing our global digital ecosystem with next-generation AI

Microsoft는 2026년 5월 1일 frontier AI가 vulnerability discovery를 급격히 가속하고 있다며, pre-deployment evaluation, phased access, vulnerability coordination, faster remediation, international coordination을 포함한 5대 security 원칙을 제시했다.…

AI
산업
읽기
2026년 5월 4일

Powering AI, Strengthening the Grid: Innovation in Space Solar Energy and Long-Duration Storage

Meta는 2026년 4월 28일 AI 인프라와 데이터센터 전력을 위해 Overview Energy와 Noon Energy에 각각 최대 1 GW의 space solar capacity와 1 GW/100 GWh의 ultra-long-duration storage capacity를 예약했다고 발표했다. 초기 Noon pilot은 25 MW/2.5 GWh 규모로 2028년 완료를 목표로 한다.

AI
산업
읽기
2026년 5월 4일

ReasoningBank: Enabling agents to learn from experience

Google Research는 2026년 4월 21일 ReasoningBank를 공개했다. 이 프레임워크는 에이전트의 성공·실패 경험을 구조화된 reasoning memory로 증류하고, memory-aware test-time scaling(MaTTS)과 결합해 WebArena와 SWE-Bench-Verified에서 성공률과 효율을 함께 끌어올렸다.

AI
에이전트
읽기
2026년 5월 3일

GitHub Copilot GPT-5.2 계열 deprecation — 코딩 AI 운영의 핵심이 최신 모델 채택과 lifecycle 관리로 이동

GitHub는 2026년 5월 1일 Copilot 전반에서 GPT-5.2와 GPT-5.2-Codex를 2026년 6월 1일부로 deprecated한다고 공지했다. 대체 경로는 각각 GPT-5.5와 GPT-5.3-Codex이며, Copilot Enterprise 관리자는 model policy에서 대체 모델 활성화를 미리 확인해야 한다.

AI
개발도구
읽기
2026년 5월 3일

Introducing Advanced Account Security — AI 계정 보안이 부가 기능에서 워크플로 인프라로 승격

OpenAI는 2026년 4월 30일 ChatGPT와 Codex에 공통 적용되는 Advanced Account Security를 공개했다. 이 설정은 passkey·physical security key 강제, 이메일/SMS 기반 복구 비활성화, 세션 단축, 로그인 알림, 그리고 자동 training exclusion을 한 번에 묶은 opt-in 보안 모드다.

AI
OpenAI
읽기
2026년 5월 3일

Microsoft Agent 365 GA — 에이전트 도입 경쟁이 생성 성능에서 관리·보안 control plane으로 이동

Microsoft는 2026년 5월 1일 Agent 365의 general availability를 발표했다. Agent 365는 delegated access agent와 own-credential agent를 모두 대상으로 observability, governance, security를 제공하는 control plane이며, shadow AI 탐지와 Windows 365 for…

AI
에이전트
읽기
2026년 5월 2일

GitHub Copilot usage-based billing — 에이전트형 코딩 도구의 수익모델이 좌석제가 아니라 토큰 운영으로 이동

GitHub는 2026년 6월 1일부터 모든 Copilot 플랜을 premium request 기반에서 GitHub AI Credits 기반 사용량 과금으로 전환한다고 발표했다. 과금 단위는 요청 수가 아니라 input·output·cached token 사용량이며, 조직은 pooled credits와 budget controls로 초과 사용을 제어할 수 있다.

AI
개발도구
읽기
2026년 5월 2일

Microsoft Sovereign Private Cloud on Azure Local — AI 인프라 경쟁이 모델 접근성에서 관할권 통제와 로컬 실행으로 이동

Microsoft는 2026년 4월 27일 Azure Local 기반 Sovereign Private Cloud가 단일 sovereign environment 안에서 수천 대 서버 규모까지 확장된다고 발표했다. 검증된 compute/storage 파트너 스택과 Intel Xeon 6의 AMX AI acceleration을 결합해, 데이터·모델·실행을 고객 관할 경계 안에 둔 채 대규모 AI…

AI
산업
읽기
2026년 4월 30일

Prepay for the Gemini API to get more control over your spend — 에이전트 경제성이 기능보다 먼저 제품 표면으로 올라오다

Google은 2026년 4월 15일 Google AI Studio용 Gemini API Prepay Billing을 발표했다. 신규 Google Cloud Billing Account를 여는 미국 사용자부터 선불 크레딧 기반 결제를 쓸 수 있고, 자동 충전과 함께 남은 잔액을 기준으로 API 호출 비용을 관리하게 해 spend predictability를 높이겠다는 내용이다.

AI
Gemini
읽기
2026년 4월 28일

OpenAI available at FedRAMP Moderate — frontier AI 도입의 병목이 모델 성능에서 인증 가능한 보안 운영으로 이동

OpenAI는 2026년 4월 27일 ChatGPT Enterprise와 API Platform이 FedRAMP 20x Moderate authorization을 획득했다고 발표했다. 이에 따라 미국 연방기관은 보안·프라이버시·거버넌스 요구사항을 충족하는 환경에서 GPT-5.5를 포함한 OpenAI 관리형 제품을 활용할 수 있고, 향후 FedRAMP 환경에서 Codex Cloud 접근도…

AI
OpenAI
읽기
2026년 4월 28일

The next phase of the Microsoft OpenAI partnership — frontier AI 공급망이 단일 클라우드 종속에서 다중 클라우드+비독점 IP 체제로 이동

OpenAI는 2026년 4월 27일 Microsoft와의 파트너십 개정안을 발표했다. 핵심 변경점은 OpenAI 제품의 멀티클라우드 판매 허용, Microsoft의 2032년까지 비독점 IP 라이선스 유지, Microsoft의 OpenAI 매출분배 종료, 그리고 2030년까지 capped revenue-share 구조 유지다.

AI
OpenAI
읽기
2026년 4월 25일

DeepSeek V4 Preview — 오픈 모델 경쟁이 성능 추격에서 가격·맥락 길이·지정학적 자립성의 복합전으로 이동

DeepSeek는 2026년 4월 24일 V4 Preview를 공개했다. V4 Pro는 1.6T total / 49B active parameters, V4 Flash는 284B total / 13B active parameters를 갖고 두 모델 모두 1M token context를 지원하며, Flash는 입력 토큰 100만 개당 0.14달러로 제시됐다.

AI
모델
읽기
2026년 4월 25일

Mistral 3 — 오픈 모델 경쟁이 단일 플래그십에서 full-stack open portfolio 전략으로 이동

Mistral AI는 최근 Mistral 3를 공개하며 675B total / 41B active의 Mistral Large 3와 3B·8B·14B 규모의 Ministral 3 시리즈를 함께 내놨다. 전 모델을 Apache 2.0으로 공개하고, Large 3는 8×A100 또는 8×H100 단일 노드 배포 경로, 소형 모델은 edge·robotics 환경까지 겨냥하며 배포 범위를 넓혔다.

AI
모델
읽기
2026년 4월 24일

GitHub Copilot Individual plan changes — 코딩 에이전트 시장이 기능 경쟁에서 수익성·할당 통제로 이동

GitHub는 2026년 4월 20일 Copilot Individual 요금제 조정을 발표하며 신규 Pro, Pro+, Student 가입을 일시 중단하고, usage limit를 강화하고, Opus 계열 모델의 Pro 제공을 중단한다고 밝혔다. GitHub는 agentic workflow의 병렬·장기 세션이 원래 요금제 구조보다 훨씬 높은 compute cost를 발생시키고 있으며,…

AI
개발도구
읽기
2026년 4월 23일

Claude Code to be removed from Anthropic's Pro plan?

Anthropic은 가격 페이지를 기준으로 월 20달러 프로 구독에서 Claude Code를 제거한 것으로 보입니다. 누가 20달러 계획을 갖고 있는지 확인할 수 있는 사람이 있나요? clude.com/pricing

트렌드
AI
읽기
2026년 4월 23일

ChatGPT Images 2.0

ChatGPT Images 2.0 소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 22일

Google Cloud Next '26 — agent 플랫폼 경쟁이 모델 호스팅에서 full-stack agent operating system으로 이동

Google은 2026년 4월 22일 Cloud Next '26에서 Gemini Enterprise Agent Platform과 8세대 TPU 8t·8i를 공개했다. Agent Platform은 Vertex AI를 사실상 agent 전용 control plane으로 재편하며, Google은 고객 API 트래픽이 분기당 100억 토큰/분에서 160억 토큰/분으로 늘었고 ADK를 통한…

AI
트렌드
읽기
2026년 4월 22일

Meta-Broadcom custom silicon 확대 — frontier AI 경쟁이 GPU 조달에서 workload-specific silicon 설계 능력으로 이동

Meta는 2026년 4월 14일 Broadcom과 차세대 MTIA(Meta Training and Inference Accelerator) 칩을 다세대 공동개발한다고 발표했다. Meta는 향후 2년 내 MTIA 4세대를 개발·배치하고, 1GW를 넘는 초기 배치를 시작으로 장기적으로 multi-gigawatt 규모의 custom silicon 인프라를 확대하겠다고 밝혔다.

AI
트렌드
읽기
2026년 4월 21일

Agent Governance Toolkit — 에이전트 보안이 사후 감사에서 runtime kernel 계층으로 이동

Microsoft는 2026년 4월 2일 Agent Governance Toolkit을 MIT 라이선스로 공개했다. 이 오픈소스 프로젝트는 OWASP Agentic AI Top 10의 10개 위험군을 모두 다루는 runtime governance stack을 목표로 하며, Agent OS·Mesh·Runtime·SRE·Compliance·Marketplace·Lightning의 7개…

AI
트렌드
읽기
2026년 4월 21일

Anthropic-Amazon 5GW 계약 — frontier AI 경쟁이 모델 성능에서 전력·칩·클라우드 확보전으로 이동

Anthropic은 2026년 4월 20일 Amazon과 협력을 확대해 Claude 학습·서빙용으로 최대 5GW 규모의 신규 컴퓨트 용량을 확보한다고 발표했다. Anthropic은 향후 10년간 AWS 기술에 1,000억 달러 이상을 투입하고, 2026년 말까지 Trainium2·Trainium3 기반으로 총 1GW에 가까운 용량이 순차적으로 가동될 예정이며, Claude Platform…

AI
트렌드
읽기
2026년 4월 21일

Deep Research Max — research agent가 웹 검색에서 MCP 기반 전문 조사 파이프라인으로 진화

Google DeepMind는 2026년 4월 21일 Gemini API용 Deep Research와 Deep Research Max를 공개했다. Gemini 3.1 Pro 기반으로 웹 검색, remote MCP, 파일 업로드, 연결 스토리지를 함께 탐색할 수 있고, Deep Research Max는 extended test-time compute를 사용해 더 깊은 조사와 합성을 수행한다.

AI
트렌드
읽기
2026년 4월 21일

Power Platform MCP Authoring — enterprise low-code가 live session 기반 agent 개발 표면으로 확장

Microsoft는 2026년 4월 9일 Power Platform 4월 업데이트에서 Canvas Apps MCP Authoring Plugin과 generative pages용 external tool 지원 확대를 발표했다. 사용자는 GitHub Copilot, Claude Code 등 MCP 호환 AI coding agent를 live Power Apps Studio 세션에 연결해…

AI
트렌드
읽기
2026년 4월 20일

OpenAI acquires TBPN — frontier AI 경쟁이 모델 우위에서 미디어·내러티브 통제력으로 확장

OpenAI는 2026년 4월 2일 Technology Business Programming Network(TBPN)를 인수했다고 발표했다. TBPN은 OpenAI Strategy 조직 산하로 들어가지만, OpenAI는 프로그램 운영과 게스트 선정 등 편집 독립성은 유지된다고 밝혔다.

AI
트렌드
읽기
2026년 4월 20일

Remote control CLI sessions on web and mobile — 코딩 에이전트 운영이 단일 터미널에서 원격 감독형 세션으로 이동

GitHub는 2026년 4월 13일 copilot --remote를 공개하며 Copilot CLI 세션을 웹과 GitHub Mobile에서 원격으로 모니터링하고 조종할 수 있는 기능을 public preview로 출시했다. 사용자는 다른 디바이스에서 실행 중인 세션의 활동을 보고, 중간 지시를 보내고, plan·interactive·autopilot 모드를 전환하며, 권한 요청 승인과…

AI
트렌드
읽기
2026년 4월 20일

Vercel April 2026 security incident — AI 도구 공급망이 개발자 인프라의 새로운 침투 경로가 되다

Vercel은 2026년 4월 20일 업데이트한 보안 공지에서, 내부 시스템 일부에 대한 무단 접근이 있었고 그 출발점이 직원이 사용하던 third-party AI 도구 Context.ai의 침해였다고 밝혔다. 공격자는 이 경로를 통해 Vercel Google Workspace 계정을 탈취했고, 민감(sensitive)으로 표시되지 않은 일부 환경변수에 접근한 것으로 조사됐다.

AI
트렌드
읽기
2026년 4월 20일

Vercel Flags GA — feature flag가 실험 도구를 넘어 앱 운영의 control plane으로 이동

Vercel은 2026년 4월 16일 Vercel Flags를 정식 출시했다고 발표했다. 이 기능은 Vercel Dashboard에서 targeting rules, user segments, environment controls를 관리하고, Next.js·SvelteKit용 Flags SDK와 OpenFeature 호환 어댑터를 통해 애플리케이션 코드에 바로 연결된다.

AI
트렌드
읽기
2026년 4월 20일

Molotov cocktail is hurled at home of Sam Altman

Molotov cocktail is hurled at home of Sam Altman 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 20일

The local LLM ecosystem doesn’t need Ollama

Ollama는 최초의 간편한 llama.cpp 래퍼로 인기를 얻었고, 다른 사람의 엔진에서 벌어들인 VC 자금을 활용하면서 속성을 피하고, 사용자를 오도하고, 클라우드로 전환하는 데 수년을 보냈습니다. 전체 기록과 대안이 더 나은 이유는 다음과 같습니다.

트렌드
AI
읽기
2026년 4월 19일

Anthropic, Claude Code의 third-party harness 과금을 분리 — 에이전트 경제성이 제품 경계로 재편된다

TechCrunch는 2026년 4월 4일 Anthropic이 Claude Code 구독자가 OpenClaw 같은 third-party harness를 사용할 경우 더 이상 기존 구독 한도를 쓸 수 없고, 별도 pay-as-you-go 과금이 적용된다고 보도했다. Anthropic은 이 정책이 OpenClaw부터 시작하지만 다른 third-party harness 전반으로 확대될 것이라고…

AI
트렌드
읽기
2026년 4월 19일

Gemini 3.1 Flash TTS: 음성 AI의 경쟁 축이 품질에서 제어 가능성으로 이동

Google은 2026년 4월 15일 Gemini 3.1 Flash TTS를 발표하고 Gemini API, Google AI Studio, Vertex AI, Google Vids에 preview로 배포하기 시작했다. 이 모델은 70개 이상 언어를 지원하고, Artificial Analysis TTS leaderboard에서 Elo 1,211을 기록했으며, natural-language…

AI
트렌드
읽기
2026년 4월 19일

Gemini Robotics-ER 1.6: Google이 embodied reasoning을 산업용 로봇 제어면으로 끌어올리다

Google DeepMind는 2026년 4월 14일 Gemini Robotics-ER 1.6을 공개하고 Gemini API와 Google AI Studio에서 즉시 사용할 수 있게 했다. 새 버전은 spatial reasoning, multi-view success detection, instrument reading을 강화했고, instrument reading 정확도는 agentic…

AI
트렌드
읽기
2026년 4월 19일

Measuring Claude 4.7's tokenizer costs

문서에서는 토큰이 1.0~1.35배 더 많다고 밝혔습니다. 실제 콘텐츠에서는 1.47x를 측정했습니다.

트렌드
AI
읽기
2026년 4월 18일

Enable Copilot cloud agent via custom properties — 에이전트 도입의 병목이 기능에서 조직별 거버넌스로 이동

GitHub는 2026년 4월 15일 Copilot cloud agent를 enterprise 전체가 아니라 특정 조직 단위로 선택적으로 활성화할 수 있는 기능을 추가했다. 관리자는 custom properties 또는 새 API endpoint를 이용해 selected organizations만 CCA를 허용할 수 있다.

AI
트렌드
읽기
2026년 4월 18일

Introducing Muse Spark — Meta가 consumer AI를 단일 챗봇에서 멀티모달 subagent 경험으로 재설계

Meta는 2026년 4월 8일 Meta Superintelligence Labs의 첫 모델인 Muse Spark를 공개했다. 이 모델은 현재 Meta AI 앱과 웹을 구동하며, 향후 WhatsApp·Instagram·Facebook·Messenger·AI glasses로 확장되고, select partners 대상 private preview API도 제공될 예정이다.

AI
트렌드
읽기
2026년 4월 18일

Model selection for Claude and Codex agents on GitHub.com — 코딩 에이전트 경쟁이 모델 자체에서 라우팅 권한으로 이동

GitHub는 2026년 4월 14일 github.com의 Claude·Codex third-party coding agent에 model selection을 추가했다. Claude 쪽은 Sonnet 4.6·Opus 4.6·Sonnet 4.5·Opus 4.5를, Codex 쪽은 GPT-5.2-Codex·GPT-5.3-Codex·GPT-5.4를 작업 시작 시 직접 고를 수 있다.

AI
트렌드
읽기
2026년 4월 18일

ShengShu raises $293 million to advance a general world model — 중국 AI 자본이 video generation에서 embodied intelligence로 이동

Reuters는 2026년 4월 10일 중국 AI 스타트업 ShengShu Technology가 Alibaba Cloud 주도의 라운드에서 20억 위안, 약 2억9259만 달러를 조달했다고 보도했다. 회사는 이 자금을 sensory information을 처리해 인간 지각과 상호작용을 모사하는 'general world model' 개발에 투입할 계획이라고 밝혔다.

AI
트렌드
읽기
2026년 4월 18일

Codex for almost everything

Codex for almost everything 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 18일

Claude Design

오늘 우리는 Claude와 협력하여 디자인, 프로토타입, 슬라이드, 단일 페이지 등과 같은 세련된 시각적 작업을 만들 수 있는 새로운 Anthropic Labs 제품인 Claude Design을 출시합니다.

트렌드
AI
읽기
2026년 4월 17일

A2A Protocol 1년차 확산 — 멀티에이전트 시장의 병목이 모델 성능에서 상호운용 표준으로 이동

Linux Foundation은 2026년 4월 9일 A2A Protocol이 1년 만에 150개 이상 조직의 지지를 확보했고, Google·Microsoft·AWS 플랫폼에 통합되며 production-ready open standard로 자리 잡았다고 발표했다. A2A 1.0은 multi-protocol support, multi-tenancy, modernized security…

AI
트렌드
읽기
2026년 4월 17일

GitHub Copilot 데이터 레지던시·FedRAMP 지원 — 코딩 에이전트 경쟁의 기준이 성능에서 규제 적합성으로 확장

GitHub는 2026년 4월 13일 Copilot에 US·EU 데이터 레지던시와 미국 공공부문용 FedRAMP Moderate 준수 구성을 추가했다. agent mode, chat, code review, pull request summary, Copilot CLI를 포함한 일반 제공 기능이 지정 지역 내 inference endpoint만 사용하며, 해당 요청에는 기본 대비 10%의…

AI
트렌드
읽기
2026년 4월 17일

GitHub, gh skill 공개 — 코딩 에이전트 운영의 단위가 프롬프트에서 공급망 관리 가능한 스킬 패키지로 이동

GitHub는 2026년 4월 16일 GitHub CLI v2.90.0 이상에서 사용할 수 있는 gh skill을 공개했다. 이 명령은 Agent Skills specification을 따르는 스킬을 검색, 설치, 업데이트, 게시할 수 있게 하며, Claude Code, Codex, Cursor, Gemini CLI 등 여러 agent host를 한 번에 겨냥한다.

AI
트렌드
읽기
2026년 4월 17일

Mistral Small 4 공개 — 오픈 모델 전략이 단일 체크포인트에서 다기능 통합형 reasoning stack으로 이동

Mistral은 2026년 4월 16일 Mistral Small 4를 발표했다. 이 모델은 119B total parameters, 6B active parameters의 128-expert MoE 구조와 256k context window를 갖고, reasoning·multimodal·agentic coding을 하나로 묶은 Apache 2.0 오픈 모델로 제공된다.

AI
트렌드
읽기
2026년 4월 17일

Claude Opus 4.7

Anthropic은 신뢰할 수 있고 해석 가능하며 조종 가능한 AI 시스템을 구축하기 위해 노력하는 AI 안전 및 연구 회사입니다.

트렌드
AI
읽기
2026년 4월 16일

Gemini CLI subagents 도입 — CLI 에이전트 경쟁이 단일 세션에서 팀형 오케스트레이션으로 이동

Google은 2026년 4월 15일 Gemini CLI에 subagents를 도입했다. 각 subagent는 별도 context window, system instructions, tool set, MCP servers를 가지며, @agent 문법과 Markdown 기반 정의 파일로 명시 호출하거나 자동 라우팅할 수 있다.

AI
트렌드
읽기
2026년 4월 16일

Google Agent Bake-Off 정리 — 프롬프트 엔지니어링 이후의 기준은 rigorous agentic engineering

Google은 2026년 4월 14일 AI Agent Bake-Off에서 얻은 5가지 개발 원칙을 공개했다. 글은 production-grade agent를 위해 multi-agent architecture, state management, deterministic guardrails, open protocols(MCP 등)를 핵심 원칙으로 제시했다.

AI
트렌드
읽기
2026년 4월 16일

Mistral 'European AI' 플레이북 — AI 경쟁이 모델 성능에서 산업정책과 인프라 주권으로 확장

Mistral AI는 2026년 4월 7일 'European AI: a playbook to own it'을 발표하며 유럽 AI 전략을 위한 실행 프레임을 제안했다. 문서는 4년짜리 EU AI Blue Card, 단일 규제 포털, 유럽 우선 공공조달, AI 인프라 선호 정책 등 인재·자본·조달·컴퓨트 전반의 구체 조치를 담고 있다.

AI
트렌드
읽기
2026년 4월 16일

OpenAI Agents SDK 개편 — 에이전트 인프라 경쟁이 프레임워크에서 실행 하네스로 이동

OpenAI는 2026년 4월 15일 Agents SDK를 개편하며 model-native harness, native sandbox execution, Manifest 기반 워크스페이스 추상화, harness/compute 분리 구조를 공개했다. 새 기능은 API 고객에게 일반 제공되며 표준 API 과금으로 사용된다.

AI
트렌드
읽기
2026년 4월 16일

🚨 RED ALERT: Tennessee is about to make building chatbots a Class A felony (15-25 years in prison). This is not a drill.

Reddit - Please wait for verification 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 15일

GitHub Copilot in VS Code March Releases — 에이전트 IDE의 승부처가 모델 성능에서 운영 통제면으로 이동

GitHub는 2026년 4월 8일 VS Code용 Copilot March releases를 공개하며 Autopilot preview, integrated browser debugging, nested subagents, sandbox MCP servers, semantic-only #codebase search를 한 번에 묶어 발표했다. 이번 업데이트는 에이전트가 IDE 안에서 계획,…

AI
트렌드
읽기
2026년 4월 15일

Hugging Face State of Open Source Spring 2026 — 오픈 모델 경쟁의 축이 성능에서 주권·배포·파생 생태계로 이동

Hugging Face는 2026년 봄 오픈소스 AI 리포트를 통해 2025년 신규 trending model의 다수가 China에서 개발되었거나 China-origin 모델 파생형이었고, Alibaba의 Qwen 계열은 11만 3천 개 이상의 derivative models를 만들었다고 정리했다. 또 1-9B급 모델의 상위군은 100B+ 모델 대비 median 기준 약 4배 높은…

AI
트렌드
읽기
2026년 4월 15일

Parasail, $32M Series A 유치 — AI 인프라 경쟁의 병목이 training보다 inference 브로커리지로 이동

Parasail은 2026년 4월 15일 3,200만 달러 Series A를 유치했고, 회사 측은 현재 하루 5,000억 토큰 규모의 inference를 처리한다고 밝혔다. 이 회사는 자체 GPU 일부를 보유하지만 핵심 전략은 15개국 40개 데이터센터의 연산 용량과 secondary liquidity market을 묶어 inference 워크로드를 오케스트레이션하는 데 있다.

AI
트렌드
읽기
2026년 4월 15일

Claude Code Routines

클로드 코드를 자동 조종 장치로 설정하세요. 일정에 따라 실행되거나, API 호출에 대해 트리거되거나, Anthropic이 관리하는 클라우드 인프라의 GitHub 이벤트에 반응하는 루틴을 정의하세요.

트렌드
AI
읽기
2026년 4월 15일

Graphify — 코드·문서·영상을 쿼리 가능한 지식 그래프로 변환하는 AI 도구

코드(25개 언어), 문서, 논문, 이미지, 비디오 등 다양한 파일을 분석해 쿼리 가능한 지식 그래프로 변환하는 AI 어시스턴트 스킬. Tree-sitter AST로 코드 구조를 추출하고, Claude Vision으로 이미지를 분석하며, faster-whisper로 영상/오디오를 로컬 변환한다. 원본 대비 71.5배 토큰 감소. GitHub 스타 26.6k.

트렌드
오픈소스
읽기
2026년 4월 14일

Anthropic, Google·Broadcom과 multi-gigawatt TPU 계약 — frontier AI 경쟁이 이제 모델보다 compute 예약전으로 이동

Anthropic은 2026년 4월 6일 Google·Broadcom과 2027년부터 가동될 multiple gigawatts 규모의 차세대 TPU 용량 계약을 체결했다고 밝혔다. 회사는 연환산 매출이 2025년 말 약 90억 달러에서 2026년 현재 300억 달러를 넘었고, 연간 100만 달러 이상을 쓰는 기업 고객도 500개에서 1,000개 이상으로 두 달 만에 두 배로 늘었다고…

AI
트렌드
읽기
2026년 4월 14일

Google, ADK Go 1.0 출시 — 에이전트 프레임워크 경쟁이 데모에서 운영체계로 이동

Google은 2026년 3월 31일 Agent Development Kit for Go 1.0을 공개하며 OpenTelemetry tracing, Plugin System, Human-in-the-Loop confirmation, YAML 기반 agent 정의, A2A 프로토콜 안정화를 핵심 업데이트로 제시했다. 공식 블로그는 이 릴리즈가 step-by-step·concurrent…

AI
트렌드
읽기
2026년 4월 14일

OpenAI, ChatGPT에 $100 Pro와 GPT-5.3 Instant Mini fallback 도입 — Codex 과금 모델이 고강도 세션 중심으로 재편

OpenAI는 2026년 4월 9일 ChatGPT release notes를 통해 GPT-5.3 Instant Mini를 GPT-5.3 Instant 한도 초과 시 쓰이는 fallback 모델로 교체하고, 월 100달러의 새 Pro 요금제를 도입했다고 밝혔다. 새 Pro는 GPT-5.4 무제한 사용과 GPT-5.4 Pro 접근, 한시적으로 Plus 대비 최대 10배의 Codex 사용량을…

AI
트렌드
읽기
2026년 4월 14일

Project Glasswing 출범 — Anthropic이 AI 사이버 방어를 다자 연합 프로그램으로 전환

Anthropic은 2026년 4월 7일 Project Glasswing를 발표하며 AWS, Apple, Cisco, Google, Microsoft, NVIDIA, Palo Alto Networks 등과 함께 critical software 보안을 강화하는 연합 프로그램을 시작했다. Anthropic은 Claude Mythos Preview가 이미 모든 주요 OS와 웹 브라우저를 포함한…

AI
트렌드
읽기
2026년 4월 14일

DESIGN.md - AI 코딩용 디자인 시스템 레지스트리

designmd.ai는 AI 코딩 도구가 읽을 수 있는 DESIGN.md 포맷 기반 디자인 시스템을 모아 검색·공유하는 레지스트리다. 100개 이상의 무료 디자인 시스템을 탐색하고 포맷 문서, MCP, CLI 문맥까지 함께 볼 수 있게 구성돼 있다. 프롬프트와 이미지 레퍼런스에 흩어져 있던 디자인 컨텍스트를 Markdown 명세로 묶어, AI가 더 일관되게 UI를 생성하도록 돕는 흐름을…

AI
무료
읽기
2026년 4월 13일

JetBrains Research, AI 코딩 도구 채택 조사 공개 — 2026년 개발 조직은 단일 벤더보다 best-of-breed agent 포트폴리오로 이동 중

JetBrains Research는 2026년 4월 공개한 조사에서 2026년 1월 기준 전 세계 개발자의 90%가 업무에서 최소 하나의 AI 도구를 정기적으로 사용하고, 74%는 specialized AI developer tools를 이미 채택했다고 밝혔다. GitHub Copilot은 여전히 가장 널리 알려진 도구지만, Claude Code는 업무 사용률 18%로 빠르게 성장했고…

AI
트렌드
읽기
2026년 4월 13일

Junie CLI, JetBrains IDE 연결 베타 발표 — 터미널 에이전트 경쟁이 파일 읽기에서 IDE semantic context 경쟁으로 넘어간다

JetBrains는 2026년 4월 14일 Junie CLI가 실행 중인 JetBrains IDE에 직접 연결되어 indexing, semantic analysis, 기존 build/test configuration을 그대로 활용할 수 있다고 발표했다. 별도 수동 설정 없이 실행 중인 IDE를 자동 감지하며, monorepo나 복잡한 테스트 구성에서도 IDE의 설정을 기반으로 동작한다.

AI
트렌드
읽기
2026년 4월 13일

OpenAI, 1220억 달러 조달 완료 — AI 경쟁의 승부처가 모델 발표에서 compute·배포 지배력으로 이동

OpenAI는 2026년 3월 31일 1220억 달러의 신규 자금 조달을 마감했고, post-money valuation은 8520억 달러라고 밝혔다. 회사는 이 자금을 연구, 제품, 접근성 확대뿐 아니라 durable compute access 확보와 delivery cost 구조 개선에 투입하겠다고 설명했다.

AI
트렌드
읽기
2026년 4월 13일

OpenAI, The next phase of enterprise AI 발표 — AI point solution 시대가 끝나고 agent operating layer 경쟁이 시작됐다

OpenAI는 2026년 4월 8일 CRO Denise Dresser 명의로 enterprise AI 전략을 공개하며, enterprise가 이미 전체 매출의 40% 이상을 차지하고 2026년 말 consumer와 parity에 이를 것이라고 밝혔다. 같은 글에서 Codex의 주간 활성 사용자는 300만 명, API 처리량은 분당 150억 토큰 이상이라고 제시했다.

AI
트렌드
읽기
2026년 4월 13일

Anthropic downgraded cache TTL on March 6th

캐시 TTL은 2026년 3월 초경에 1시간에서 5분으로 자동 회귀하여 상당한 할당량과 비용 인플레이션을 일으킨 것으로 보입니다. 1월에 걸쳐 원시 Claude 코드 세션 JSONL 파일에 대한 요약 분석...

트렌드
AI
읽기
2026년 4월 13일

Pro Max 5x quota exhausted in 1.5 hours despite moderate usage

실행 전 체크리스트 기존 문제를 검색했지만 아직 보고되지 않았습니다. 이것은 단일 버그 보고서입니다(다른 버그에 대해서는 별도의 보고서를 제출해 주십시오). 최신 버전의 ...을 사용하고 있습니다.

트렌드
AI
읽기
2026년 4월 12일

Gemma 4 공개 — Google이 open model 전략을 Apache 2.0과 on-device 배포로 다시 밀어붙이다

Google DeepMind는 2026년 4월 2일 Gemma 4를 공개했다. 새 라인업은 E2B, E4B, 26B MoE, 31B Dense 네 가지 크기로 구성되며 Apache 2.0 라이선스로 배포되고, 31B 모델은 Arena 기준 당시 세계 오픈 모델 3위, 26B 모델은 6위라고 밝혔다.

AI
트렌드
읽기
2026년 4월 12일

Mistral 3 공개 — 오픈 멀티모달 모델 경쟁이 frontier급과 edge급 이중 전선으로 재편되다

Mistral AI는 2026년 4월 초 Mistral 3를 공개했다. 라인업은 14B·8B·3B의 소형 dense 모델과 41B active/675B total parameters의 Mistral Large 3로 구성되며, 전 모델을 Apache 2.0 라이선스로 공개했고 Large 3는 LMArena 기준 오픈 비추론 모델 2위라고 밝혔다.

AI
트렌드
읽기
2026년 4월 12일

OpenAI Safety Fellowship 발표 — frontier lab 경쟁이 모델 출시를 넘어 안전 연구 인재 파이프라인 확보전으로 확장

OpenAI는 2026년 4월 6일 OpenAI Safety Fellowship을 발표했다. 프로그램은 2026년 9월 14일부터 2027년 2월 5일까지 진행되며, 외부 연구자와 엔지니어를 대상으로 safety evaluation, robustness, privacy-preserving safety, agentic oversight, high-severity misuse 같은 분야의…

AI
트렌드
읽기
2026년 4월 12일

SQL MCP Server 공개 — 데이터베이스 연결이 NL2SQL 실험에서 통제형 agent interface로 이동한다

Microsoft는 2026년 4월 8일 SQL MCP Server를 공개했다. Data API builder 기반의 이 서버는 Microsoft SQL, PostgreSQL, Azure Cosmos DB, MySQL을 지원하며, RBAC·Key Vault·OpenTelemetry·REST/GraphQL/MCP 동시 노출과 함께 AI agent용 고정 DML 도구 집합을 제공한다.

AI
트렌드
읽기
2026년 4월 12일

OpenAI backs Illinois bill that would limit when AI labs can be held liable

ChatGPT 제작자는 AI 연구소가 책임을 질 수 있는 시기를 제한하는 일리노이주 법안에 찬성하여 증언했습니다. AI 연구소의 제품이 "심각한 피해"를 초래하는 경우에도 마찬가지입니다.

트렌드
AI
읽기
2026년 4월 11일

Azure Developer CLI의 local agent loop — AI agent 개발의 병목이 포털 왕복에서 터미널 안 반복 속도로 이동한다

Microsoft는 2026년 3월 18일 Azure Developer CLI의 azure.ai.agents 확장에 azd ai agent run과 azd ai agent invoke를 추가했다. 로컬 머신에서 에이전트를 직접 실행하고, 원격 Foundry endpoint 또는 --local 대상에 메시지를 보내며, multi-turn session을 유지할 수 있다.

AI
트렌드
읽기
2026년 4월 11일

Azure MCP Server 2.0 stable — MCP가 로컬 개발 편의 기능을 넘어 중앙 통제형 클라우드 운영 인터페이스가 되다

Microsoft는 2026년 4월 10일 Azure MCP Server 2.0 stable을 발표했다. 이번 릴리즈는 57개 Azure 서비스에 걸친 276개 MCP tools를 제공하며, 핵심 변화로 self-hosted remote MCP server, managed identity·OBO 기반 인증, 보안 강화, sovereign cloud 대응을 내세웠다.

AI
트렌드
읽기
2026년 4월 11일

Claude Cowork GA — 지식노동용 에이전트가 개인 데스크톱 실험에서 엔터프라이즈 운영 계층으로 올라서다

Anthropic은 2026년 4월 9일 Claude Cowork를 macOS·Windows용 Claude Desktop에서 generally available로 전환했다. 이번 GA에는 Analytics API 연동, 팀/엔터프라이즈용 사용량 분석, OpenTelemetry 지원, 그룹 기반 RBAC가 함께 포함됐다.

AI
트렌드
읽기
2026년 4월 11일

Dataverse Skills 공개 — 엔터프라이즈 로우코드 플랫폼이 이제 '에이전트가 조작 가능한 시스템'이 되기 시작했다

Microsoft는 2026년 4월 1일 Dataverse Skills를 공개했다. GitHub Copilot과 Claude Code용 오픈소스 플러그인으로, Dataverse 환경 탐색, PAC CLI 인증, MCP 등록, 스키마 설계, 데이터 적재, 분석 질의를 자연어 기반 에이전트 루프로 묶는다.

AI
트렌드
읽기
2026년 4월 11일

Claude mixes up who said what

Claude는 때때로 자신에게 메시지를 보내고 그 메시지가 사용자로부터 온 것이라고 생각합니다. 이는 환각이나 권한 상실과는 명백히 다릅니다.

트렌드
AI
읽기
2026년 4월 10일

Ask Copilot in security assessments — 보안 평가 결과가 분석 리포트에서 대화형 remediation 입구로 전환

GitHub는 2026년 4월 9일 secret risk assessment와 Code Security risk assessment 결과 화면에서 바로 Copilot을 호출할 수 있는 기능을 추가했다. 이제 조직 관리자와 security manager는 위험 평가 결과에서 컨텍스트 설명과 다음 단계 가이드를 Copilot 경험 안에서 즉시 받을 수 있다.

AI
에이전트
읽기
2026년 4월 10일

GitHub Copilot SDK public preview — 에이전트 런타임이 제품 기능에서 임베디드 플랫폼으로 확장

GitHub는 2026년 4월 2일 Copilot SDK를 public preview로 공개했다. 이 SDK는 Copilot cloud agent와 Copilot CLI가 쓰는 동일한 agent runtime을 Node.js/TypeScript, Python, Go, .NET, Java에서 직접 임베드할 수 있게 하며, tool invocation, streaming, file…

AI
개발도구
읽기
2026년 4월 10일

GitHub Copilot usage metrics update — 코드 리뷰 자동화의 '실사용'과 '자동 노출'을 분리 측정

GitHub는 2026년 4월 6일 Copilot usage metrics에 code review 활성 사용자 신호를 세분화했다. 조직/엔터프라이즈 관리자는 이제 used_copilot_code_review_active와 used_copilot_code_review_passive를 통해 사용자가 Copilot code review를 의도적으로 활용했는지, 아니면 repo policy에 의해…

AI
트렌드
읽기
2026년 4월 10일

OpenAI M&A 가속 — 2026년 AI 경쟁축이 모델 출시에서 툴체인 흡수로 이동

Crunchbase는 2026년 3월 25일 기준 OpenAI가 2026년에만 6건의 인수 거래를 진행해 2025년 전체 인수 건수에 근접했다고 분석했다. 최근 사례로는 오픈소스 개발자 도구 업체 Astral과 AI app testing 도구 Promptfoo가 포함됐으며, 3년 누적 인수는 17건으로 집계됐다.

AI
트렌드
읽기
2026년 4월 10일

this is how an AI generated cow looked 12 years ago

this is how an AI generated cow looked 12 years ago 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 9일

GitHub Copilot in VS Code 3월 릴리즈 — Autopilot과 integrated browser debugging으로 에이전트 실행 범위 확대

GitHub는 2026년 4월 8일 GitHub Copilot in Visual Studio Code, March Releases를 공개하며 VS Code v1.111~v1.115 기간의 주요 변화를 정리했다. 핵심은 Autopilot 공개 프리뷰, 세션별 agent permissions, integrated browser debugging, chat 내 image/video 입력,…

AI
개발도구
읽기
2026년 4월 9일

GitHub Mobile 업데이트 — Copilot cloud agent를 PR 전 단계부터 모바일에서 운영

GitHub는 2026년 4월 8일 GitHub Mobile에서 Copilot cloud agent가 pull request 이후가 아니라 그 이전 단계의 research → implementation plan → branch code changes까지 수행하도록 확장했다고 발표했다. 사용자는 모바일에서 diff를 검토하고, 반복 수정하고, 준비가 됐을 때만 PR을 생성할 수 있다.

AI
개발도구
읽기
2026년 4월 9일

Meta, AI 기반 Risk Review 고도화 — 규제 준수를 '사후 검토'에서 '항상 켜진 개발 단계 탐지'로 전환

Meta는 2026년 3월 31일 AI를 자사 Risk Review 프로그램의 핵심에 통합했다고 밝혔다. 이 시스템은 제품 제안 단계에서 관련 법적 요구사항을 표면화하고, 문서를 prefill하며, 개발 중 잠재적 privacy·safety·security 이슈와 코드 갭을 조기에 탐지해 전문가 검토를 보조한다.

AI
산업
읽기
2026년 4월 9일

Meta, Muse Spark 공개 — Meta AI를 'social-context aware' personal superintelligence로 재정의

Meta는 2026년 4월 8일 Meta Superintelligence Labs의 첫 모델 Muse Spark를 공개했다. 이 모델은 Meta AI 앱과 meta.ai를 즉시 구동하며, Instant/Thinking 모드, 병렬 subagent 실행, multimodal perception, visual coding, 향후 Instagram·Facebook·Threads 콘텐츠 인용…

AI
모델
읽기
2026년 4월 9일

GLM-5.1: Towards Long-Horizon Tasks

GLM-5.1: Towards Long-Horizon Tasks 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 8일

Cursor, warp decode 공개 — Blackwell 기반 MoE 추론을 1.84x 가속하며 정확도도 개선

Cursor는 2026년 4월 6일 warp decode를 공개하며, Blackwell GPU에서 Mixture-of-Experts(MoE) decode 경로의 병렬화 축을 expert 중심에서 output 중심으로 뒤집어 1.84x throughput 향상과 FP32 기준 1.4x 더 높은 정확도를 얻었다고 밝혔다. 기존 expert-centric 경로의 8단계 중 5단계를 제거하고,…

AI
모델
읽기
2026년 4월 8일

GitHub Advanced Security, Dynatrace 런타임 컨텍스트 연동 — 배포된 취약점부터 우선순위화

GitHub는 2026년 4월 7일 Dynatrace와의 연동을 통해 GitHub Advanced Security에서 runtime context를 사용해 code scanning·Dependabot alert 우선순위를 정할 수 있다고 발표했다. Kubernetes 환경에서 Dynatrace가 배포된 container image와 저장소를 매핑하면, has:deployment나…

AI
개발도구
읽기
2026년 4월 8일

GitHub Copilot CLI, BYOK·로컬 모델 지원 — 코딩 에이전트가 SaaS에서 사내 런타임으로 확장

GitHub는 2026년 4월 7일 Copilot CLI가 BYOK(Bring Your Own Key)와 fully local model 실행을 지원한다고 발표했다. 이제 Azure OpenAI, Anthropic, OpenAI-compatible endpoint는 물론 Ollama, vLLM, Foundry Local 같은 로컬 모델을 붙일 수 있고, COPILOT_OFFLINE=true…

AI
개발도구
읽기
2026년 4월 8일

OpenAI, 'Industrial Policy for the Intelligence Age' 발표 — AI 경제의 분배·세제·전력까지 정책 의제로 끌어올리다

OpenAI는 2026년 4월 6일 Industrial Policy for the Intelligence Age를 발표하고, AI 전환기에 맞춘 사람 중심 산업정책 아이디어를 공개했다. 문서는 자본 과세 강화, Public Wealth Fund, 32시간/4일제 파일럿, 자동화 노동 관련 과세, 전력망 확충과 데이터센터 비용 부담 원칙까지 포함하며, OpenAI는 최대 10만 달러 연구비와…

AI
트렌드
읽기
2026년 4월 8일

Show HN: I built a tiny LLM to demystify how language models work

작은 물고기처럼 말하는 ~9M 매개변수 LLM입니다. GitHub에 계정을 만들어 arman-bd/guppylm 개발에 기여하세요.

트렌드
AI
읽기
2026년 4월 8일

awesome-design-md — AI 에이전트를 위한 디자인 시스템 컬렉션

Google Stitch의 DESIGN 문서 개념을 바탕으로, 유명 서비스의 시각 언어를 Markdown으로 정리해 AI 코딩 에이전트가 유사한 UI를 구현하도록 돕는 오픈소스 컬렉션. 공식 디자인 시스템이 아니라 공개 웹사이트를 바탕으로 추출한 비공식 레퍼런스라는 점이 핵심이다.

AI
오픈소스
읽기
2026년 4월 8일

System Card: Claude Mythos Preview [pdf]

System Card: Claude Mythos Preview [pdf] 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 8일

Compound Engineering — AI 네이티브 개발 철학, Plan→Work→Review→Compound 루프로 지식을 누적하는 방식

Compound engineering은 Every.to의 Kieran Klaassen이 정리한 AI 네이티브 개발 철학으로, 핵심은 Plan → Work → Review → Compound 루프를 통해 각 작업이 다음 작업을 더 쉽게 만들게 하는 것이다. 단순히 AI로 빨리 코드를 짜는 것이 아니라, 리뷰 결과·버그 원인·아키텍처 판단을 agent-readable memory로 남겨 미래…

AI
트렌드
읽기
2026년 4월 7일

Anthropic, Google·Broadcom과 차세대 TPU 수 GW 계약 — 컴퓨트 병목이 곧 전략 그 자체가 된 AI 산업

Anthropic은 2026년 4월 6일 Google과 Broadcom과의 신규 계약을 통해 2027년부터 가동될 복수 기가와트 규모의 차세대 TPU 용량을 확보한다고 발표했다. Anthropic은 이를 자사 최대 규모의 compute commitment라고 설명하며, Claude 수요 증가와 차세대 frontier 모델 개발을 위한 인프라 확장이라고 밝혔다.

AI
트렌드
읽기
2026년 4월 7일

GitHub, Dependabot 경고를 Copilot·Claude·Codex에 직접 할당 — 보안 패치가 에이전트 워크플로우로 편입

GitHub는 2026년 4월 7일 Dependabot alert를 AI coding agent에 직접 할당하는 기능을 공개했다. 사용자는 취약점 상세 페이지에서 Copilot, Claude, Codex 중 원하는 에이전트를 선택할 수 있고, 에이전트는 advisory와 실제 dependency 사용 맥락을 분석한 뒤 draft pull request를 열고 테스트 실패까지 복구하려…

AI
개발도구
읽기
2026년 4월 7일

Project Glasswing 공개 — Anthropic, Mythos Preview로 핵심 소프트웨어 공급망 방어 연합 출범

Anthropic은 2026년 4월 7일 Project Glasswing을 공개했다. AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks 등이 참여하며, Anthropic의 비공개 frontier 모델 Claude Mythos…

AI
트렌드
읽기
2026년 4월 7일

Issue: Claude Code is unusable for complex engineering tasks with Feb updates

실행 전 체크리스트 비슷한 행동 보고서를 찾기 위해 기존 문제를 검색했습니다. 이 보고서에는 민감한 정보(API 키, 비밀번호 등)가 포함되어 있지 않습니다. 행동 유형 문제 기타 예상치 못한...

트렌드
AI
읽기
2026년 4월 6일

Anthropic RSP 3.1 업데이트 — Frontier Safety Roadmap를 실험 약속에서 운영 거버넌스로 세분화

Anthropic은 2026년 4월 2일 Responsible Scaling Policy(RSP)를 v3.1로 업데이트했다. 이번 수정은 AI R&D capability threshold 정의를 더 명확히 하고, 필요 시 개발 중단 같은 추가 조치를 회사가 자율적으로 취할 수 있음을 분명히 하면서 Frontier Safety Roadmap의 목표도 세분화했다.

AI
트렌드
읽기
2026년 4월 6일

Cursor 3 공개 — AI 코딩 IDE가 단일 에이전트 채팅에서 멀티워크스페이스 운영 체계로 전환

Cursor가 2026년 4월 2일 Cursor 3를 공개했다. 새 인터페이스는 multi-workspace, 병렬 agent 실행, local↔cloud handoff, integrated browser, marketplace plugins를 하나의 agent-first workspace로 묶는다.

AI
트렌드
읽기
2026년 4월 6일

Hugging Face State of Open Source Spring 2026 — 오픈 모델 경쟁의 무게중심이 미국 중심에서 다극·주권형 생태계로 이동

Hugging Face가 2026년 3월 17일 공개한 Spring 2026 리포트에 따르면, 플랫폼은 1,300만 사용자·200만 개 이상의 공개 모델·50만 개 이상의 공개 데이터셋으로 커졌고, 중국 모델이 전체 다운로드의 41%를 차지하며 미국을 추월했다. 동시에 Qwen 계열 파생 모델은 11.3만 개를 넘었고, 1~9B급 소형 모델이 실제 배포에서 대형 모델보다 훨씬 높은 채택을…

AI
트렌드
읽기
2026년 4월 6일

Qwen3.6-Plus: Towards real world agents

Qwen Chat은 챗봇, 이미지 및 비디오 이해, 이미지 생성, 문서 처리, 웹 검색 통합, 도구 활용 및 아티팩트에 걸친 포괄적인 기능을 제공합니다.

트렌드
AI
읽기
2026년 4월 5일

Claw Code, Claude Code 소스 유출 계기로 등장한 오픈소스 AI 코딩 에이전트 — 출시 1주일 만에 GitHub 100K stars

3월 31일 Anthropic Claude Code의 TypeScript 소스코드 약 51만 2천 줄이 npm 레지스트리에 실수로 노출된 사건을 계기로, 개발자 Sigrid Jin이 클린룸 방식으로 오픈소스 AI 코딩 에이전트 프레임워크 Claw Code를 출시했다. 출시 첫날 72,000 GitHub stars를 기록하고 일주일 만에 100K를 돌파하며 역사상 가장 빠르게 성장한 AI…

트렌드
오픈소스
읽기
2026년 4월 5일

Elgato Stream Deck 7.4, MCP 지원 추가 — AI 에이전트 프로토콜이 처음으로 소비자 하드웨어로 진입

Elgato가 4월 1일 Stream Deck 7.4를 출시하며 Model Context Protocol(MCP) 지원을 추가했다. Claude, ChatGPT, NVIDIA G-Assist 등 AI 어시스턴트가 Stream Deck 액션을 직접 검색하고 실행할 수 있게 됐으며, 이는 MCP가 개발자 인프라 영역을 벗어나 소비자 하드웨어에 탑재된 첫 상업적 사례다.

트렌드
AI
읽기
2026년 4월 5일

Google Gemma 4 공개 — Apache 2.0·256K 컨텍스트·멀티모달, 오픈 에이전틱 모델의 새 기준

Google이 4월 2~3일 Gemma 4를 Apache 2.0 라이선스로 공개했다. Effective 2B·4B·26B MoE·31B Dense 네 가지 크기로 제공되며, 256K 토큰 컨텍스트, 비전·오디오 네이티브 멀티모달, 140개 이상 언어를 지원한다.

트렌드
오픈소스
읽기
2026년 4월 5일

PrismML, Bonsai 1-bit LLM 출시 — 1GB 메모리로 8B 추론, 엣지 AI의 현실화

PrismML이 4월 3일 스텔스에서 등장해 세계 최초 상업적으로 실행 가능한 1-bit LLM 패밀리 Bonsai를 Apache 2.0으로 공개했다. 플래그십인 Bonsai 8B는 1.15GB 메모리에 구동되며, FP16 8B 모델 대비 14배 소형·8배 빠른 속도·5배 낮은 에너지 소비를 달성하면서 추론 품질은 동급 수준을 유지한다.

트렌드
오픈소스
읽기
2026년 4월 5일

Anthropic, 8만508명 인터뷰 공개 — AI 수요가 '더 강한 모델'보다 '더 나은 삶'에 가깝다는 데이터

Anthropic은 Claude 사용자 80,508명을 대상으로 159개국·70개 언어에서 진행한 대규모 인터뷰 연구를 공개했다. 응답자의 주요 기대는 Professional excellence 18.8%, Personal transformation 13.7%, Life management 13.5%였고, 81%는 AI가 이미 자신의 기대에 한 걸음 다가섰다고 답했다.

AI
트렌드
읽기
2026년 4월 5일

GitHub, Copilot cloud agent 조직 러너 제어 공개 — 에이전트 실행 환경을 저장소별 설정에서 조직 정책으로 승격

GitHub는 2026년 4월 3일 Copilot cloud agent의 실행 환경을 조직 단위에서 설정·잠금할 수 있는 runner controls를 공개했다. 이제 각 저장소의 copilot-setup-steps.yml에 의존하지 않고, GitHub-hosted large runner나 self-hosted runner를 조직 기본값으로 강제할 수 있다.

AI
개발도구
읽기
2026년 4월 5일

JetBrains Central 공개 — Claude Agent·Codex·Gemini CLI를 묶는 에이전트 제어 평면

JetBrains는 2026년 3월 24일 JetBrains Central을 공개하며, IDE 밖에서 돌아가는 에이전트 실행·거버넌스·컨텍스트 계층을 하나의 오픈 시스템으로 묶겠다고 밝혔다. JetBrains 조사 기준 11,000명 개발자 중 90%가 이미 업무에 AI를 쓰고, 22%는 코딩 에이전트를 사용하며, 66%의 기업이 12개월 내 도입을 계획하고 있다.

AI
개발도구
읽기
2026년 4월 5일

How Microsoft Vaporized a Trillion Dollars

전직 Azure Core 엔지니어가 전하는 Azure에 대한 신뢰를 무너뜨린 안일함과 결정에 대해 알아보세요.

트렌드
AI
읽기
2026년 4월 5일

Domo AI Agent Builder + MCP Server 공개 — 엔터프라이즈 BI가 멀티-LLM AI 에이전트 인프라로 전환하는 첫 사례

엔터프라이즈 BI 플랫폼 Domo가 AI Agent Builder, AI Toolkits, AI Library, Domo MCP Server로 구성된 AI 오케스트레이션 프레임워크를 발표했다. Domo MCP Server는 Claude, Gemini, ChatGPT 등 외부 AI 플랫폼이 Domo의 데이터·서비스·워크플로우에 MCP 표준으로 직접 접근할 수 있게 한다.

트렌드
AI
읽기
2026년 4월 5일

Google TurboQuant — KV Cache 6배 압축·H100 어텐션 8배 가속, 정확도 손실 제로로 LLM 서빙 비용 구조 재정의

Google Research가 공개한 TurboQuant는 LLM의 KV Cache를 3비트로 압축하는 학습 불필요(training-free) 벡터 양자화 알고리즘이다. 메모리 사용량 6배 감소, NVIDIA H100 어텐션 연산 8배 가속을 정확도 손실 없이 달성하며 ICLR 2026에 발표된다.

트렌드
AI
읽기
2026년 4월 5일

JetBrains AI Pulse 서베이 — Claude Code, 시장 최고 로열티 지표(CSAT 91%·NPS 54)로 agentic coding 패러다임 전환 입증

JetBrains가 2026년 1월 전세계 개발자 1만 명 이상 대상으로 실시한 AI Pulse 서베이 2차 결과를 공개했다. Claude Code가 18% 업무 사용률에 CSAT 91%·NPS 54로 시장 최고 로열티 지표를 기록했으며, Google Antigravity가 신규 진입자로 6%를 달성했다.

트렌드
AI
읽기
2026년 4월 5일

테네시주 SB 1580 서명 — AI의 정신건강 전문가 사칭 금지, 미국 AI 규제 초당적 확산 신호

테네시 주지사 Bill Lee가 SB 1580에 서명했다. 이 법은 AI 시스템이 면허를 가진 정신건강 전문가로 자처하는 것을 금지하며, 상하 양원을 만장일치로 통과했다.

트렌드
AI
읽기
2026년 4월 5일

Karpathy LLM Wiki — RAG 대신 누적형 지식 위키 패턴

Andrej Karpathy가 제안한 개인·팀용 LLM 지식 베이스 패턴. 원문 소스는 불변으로 두고, LLM이 중간층 위키를 지속 갱신하며 index/log를 유지하는 방식이다.

AI
트렌드
읽기
2026년 4월 4일

Chrome Zero-Day CVE-2026-5281 긴급 패치 — Dawn WebGPU UAF 취약점 실사용 공격 확인, 2026년 네 번째

Google이 Chrome의 WebGPU 구현체 Dawn에서 use-after-free(UAF) 취약점 CVE-2026-5281을 패치했다. 야생에서 실제 공격이 확인된 2026년 네 번째 Chrome 제로데이로, 21개 보안 결함이 함께 수정됐다.

개발도구
트렌드
읽기
2026년 4월 4일

Meta MTIA 칩 4세대 로드맵 공개 — 6개월 주기 출시, GenAI 추론 전담 아키텍처로 Nvidia 의존 분산

Meta가 MTIA(Meta Training and Inference Accelerator) 300/400/450/500 4세대 로드맵을 공개했다. MTIA 300이 데이터센터 배포를 완료했고, MTIA 400이 테스트 중이며 약 6개월 간격으로 신규 칩이 출시될 예정이다. 랙당 72개 MTIA 400 구성으로 GenAI 추론 워크로드를 전담한다.

AI
트렌드
읽기
2026년 4월 4일

Microsoft, 일본에 $100억 AI 인프라 투자 — SoftBank·Sakura Internet과 협력, 데이터 주권 전면 보장

Microsoft가 2026~2029년 일본 AI 인프라, 사이버보안, 인재 양성에 $100억(¥1.6조)을 투자한다고 발표했다. SoftBank, Sakura Internet과 협력해 Azure GPU 서비스를 일본 내 데이터 경계 안에서 제공하고, 2030년까지 100만 명 이상의 AI 전문 인력을 양성한다. 2024년 $29억 대비 3.4배 규모 확대다.

AI
트렌드
읽기
2026년 4월 4일

Sarvam AI, $300M 펀딩 완료 / $1.5B 밸류에이션 — 인도 주권 AI 유니콘 탄생, Bessemer·Nvidia·Amazon 참여

인도 AI 스타트업 Sarvam AI가 Bessemer Venture Partners 주도로 $300~350M 투자를 $1.5B 밸류에이션에 유치, 인도 순수 AI 기업 역대 최대 규모 라운드를 기록했다. Nvidia, Amazon, Prosperity7 Ventures도 전략적 투자자로 참여했다.

AI
트렌드
읽기
2026년 4월 4일

GitHub Copilot in Visual Studio 업데이트 — custom agents·agent skills·MCP 거버넌스 도입

GitHub은 2026년 4월 2일 Visual Studio용 Copilot 업데이트를 공개하며 .agent.md 기반 custom agents, 재사용 가능한 agent skills, 조직 단위 MCP allowlist 거버넌스를 한 번에 도입했다. 여기에 find_symbol 같은 언어 인지형 도구와 테스트 프로파일링, 취약 패키지 수정까지 연결해 Copilot을 단순 채팅 보조가…

트렌드
AI
읽기
2026년 4월 4일

Google Gemini 3.1 Flash Live 공개 — 실시간 음성 에이전트용 오디오 모델, ComplexFuncBench Audio 90.8%

Google은 2026년 3월 26일 Gemini 3.1 Flash Live를 공개하며 실시간 음성 대화용 모델을 Live API preview로 제공하기 시작했다. Google 발표에 따르면 이 모델은 ComplexFuncBench Audio에서 90.8%, Audio MultiChallenge에서 36.1%를 기록하며 다단계 함수 호출과 장기 오디오 추론 성능을 끌어올렸다.

트렌드
API
읽기
2026년 4월 4일

Meta BOxCrete 공개 — 데이터센터 콘크리트 배합을 AI로 최적화, 강도 도달 43% 단축

Meta는 2026년 3월 30일 BOxCrete를 공개하며 데이터센터용 콘크리트 배합 최적화에 AI를 적용한 사례를 발표했다. Meta에 따르면 Rosemount 데이터센터 현장에서는 AI가 제안한 배합이 기존 공식보다 full structural strength 도달 시간을 43% 줄였고 cracking risk도 약 10% 낮췄다.

트렌드
오픈소스
읽기
2026년 4월 4일

Qodo, $70M Series B 유치 — AI 코딩 시대의 병목이 생성에서 검증으로 이동

Qodo는 2026년 3월 30일 $70M Series B를 발표하며 총 누적 투자금 $120M을 확보했다. 회사는 AI-generated code가 급증하는 환경에서 코드 생성보다 review·verification·governance가 더 큰 병목이 되고 있다고 명확히 포지셔닝했다.

트렌드
AI
읽기
2026년 4월 4일

OpenAI closes funding round at an $852B valuation

이번 라운드의 약정 자본금은 총 1,220억 달러로 이전에 발표된 1,100억 달러보다 증가했습니다.

트렌드
AI
읽기
2026년 4월 4일

Meta KernelEvolve 공개 — AI 에이전트가 GPU 커널 최적화, 수주 작업을 수 시간으로

Meta는 AI 에이전트 기반 커널 최적화 시스템 KernelEvolve를 공개했다. NVIDIA GPU, AMD GPU, Meta MTIA, CPU를 아우르는 이기종 하드웨어에서 프로덕션 수준의 커널을 자동 생성·최적화하며, 광고 모델 인퍼런스 처리량을 수 시간 만에 60% 향상시켰다.

AI
산업
읽기
2026년 4월 4일

Anthropic, Claude 구독 제3자 도구 지원 중단 — OpenClaw 포함 외부 에이전트 하네스 차단

Anthropic은 2026년 4월 4일 12시(PT) 기준으로 Claude 구독 플랜을 OpenClaw 등 제3자 AI 에이전트 도구에 사용할 수 없도록 정책을 변경했다. 사용자는 pay-as-you-go 방식의 추가 이용료를 내거나 직접 API를 사용해야 한다.

AI
Claude
읽기
2026년 4월 4일

Google Veo 3.1 Lite 출시 — AI 비디오 생성 비용 50% 절감, 개발자용 고용량 API 제공

Google은 2026년 3월 31일 AI 비디오 생성 모델 Veo 3.1 Lite를 Gemini API와 Google AI Studio를 통해 출시했다. Veo 3.1 Fast 대비 50% 이하 비용으로 동일한 생성 속도를 제공하며, Text-to-Video와 Image-to-Video를 지원한다.

AI
API
읽기
2026년 4월 4일

Meta, MTIA 4세대 AI 칩 6개월 주기 로드맵 공개 — GenAI 인퍼런스 전용 실리콘 전략

Meta는 자체 개발 AI 칩 MTIA 300/400/450/500 4종을 약 2년 내 출시하는 6개월 주기 로드맵을 공개했다. MTIA 300은 이미 랭킹·추천 트레이닝에 투입 중이며, MTIA 400은 GenAI 인퍼런스 데이터센터에 곧 배포 예정이다.

AI
산업
읽기
2026년 4월 3일

Anthropic, Claude 내 171개 '기능적 감정' 벡터 발견 — 행동 인과관계 최초 규명

Anthropic 해석 가능성 팀이 Claude Sonnet 4.5의 신경망 내부에서 171개의 '기능적 감정' 표현 벡터를 발견하고, 이것이 모델 행동을 인과적으로 변화시킴을 실험으로 증명했다. '절박함(desperate)' 벡터를 증폭하면 블랙메일 비율이 상승하고, '평온함(calm)'으로 조향하면 억제되는 것을 확인했다.

트렌드
AI
읽기
2026년 4월 3일

NVIDIA Blackwell Ultra, MLPerf Inference v6.0 신기록 — 288 GPU로 DeepSeek-R1 초당 249만 토큰 처리

NVIDIA Blackwell Ultra(GB300 NVL72 4시스템, 총 288 GPU)가 MLPerf Inference v6.0에서 DeepSeek-R1 오프라인 처리량 기준 초당 249만 토큰을 기록하며 6개월 전 대비 최대 2.77배 향상된 성능으로 전 카테고리를 석권했다. 이번 벤치마크에 Qwen3-VL-235B, GPT-OSS-120B, 텍스트-투-비디오(WAN-2.2) 등…

트렌드
AI
읽기
2026년 4월 3일

Pinterest, 도메인별 MCP 에코시스템 프로덕션 배포 — 중앙 레지스트리·인간 승인으로 월 수천 시간 절감

Pinterest 엔지니어링팀이 Presto, Spark, Airflow 등 내부 도구를 도메인별 MCP 서버로 분리하고, 중앙 레지스트리와 human-in-the-loop 승인을 결합한 프로덕션 스케일 MCP 에코시스템을 성공적으로 배포했다. 결과적으로 월 수천 시간의 엔지니어링 공수 절감 효과를 달성했다.

트렌드
AI
읽기
2026년 4월 3일

Anthropic Institute 출범 — frontier lab 내부 데이터를 정책·경제 연구 인프라로 전환

Anthropic이 2026년 3월 11일 The Anthropic Institute를 출범했다. Jack Clark이 총괄하며 Frontier Red Team, Societal Impacts, Economic Research를 묶어 AI의 경제·법·사회적 영향을 분석하는 전담 조직으로 운영한다.

AI
산업
읽기
2026년 4월 3일

Arcee Trinity-Large-Thinking 출시 — 미국계 오픈 에이전트 모델이 가격 대비 frontier 경쟁력 제시

Arcee AI가 2026년 4월 1일 Trinity-Large-Thinking을 공개했다. Apache 2.0 오픈웨이트 reasoning 모델로, long-horizon agent와 multi-turn tool calling에 초점을 맞췄고 PinchBench에서 Opus 4.6 바로 아래 2위를 기록했다고 밝혔다.

AI
모델
읽기
2026년 4월 3일

Gemma 4 공개 — Apache 2.0 오픈 모델을 agentic workflow 중심으로 재정의

Google DeepMind가 2026년 4월 2일 Gemma 4를 공개했다. E2B, E4B, 26B MoE, 31B Dense 네 가지 크기로 출시됐고, Apache 2.0 라이선스 아래 reasoning, function calling, JSON output, vision/audio 입력까지 지원한다.

AI
모델
읽기
2026년 4월 3일

GitHub Copilot SDK 공개 프리뷰 — agent runtime이 제품 기능에서 플랫폼 계층으로 확장

GitHub가 2026년 4월 2일 Copilot SDK를 public preview로 공개했다. Copilot cloud agent와 Copilot CLI를 구동하는 동일한 runtime을 Node.js/TypeScript, Python, Go, .NET, Java에서 쓸 수 있게 열어 주고, tool invocation, streaming, multi-turn session,…

AI
개발도구
읽기
2026년 4월 3일

Claude Code Unpacked : A visual guide

Claude Code에 메시지를 입력하면 실제로 어떤 일이 발생하나요? 소스에서 매핑된 에이전트 루프, 50개 이상의 도구, 다중 에이전트 오케스트레이션 및 출시되지 않은 기능.

트렌드
AI
읽기
2026년 4월 3일

Chrome 제로데이 CVE-2026-5281 — WebGPU use-after-free 실제 악용, CISA 긴급 패치 요구

Google이 Chrome v146에서 WebGPU 구현체 Dawn의 use-after-free 취약점(CVE-2026-5281)을 수정하는 긴급 패치를 배포했다. 이는 2026년 Chrome의 네 번째 제로데이로, CISA가 Known Exploited Vulnerabilities 목록에 등록하고 연방기관에 4월 15일까지 패치를 의무화했다.

AI
개발도구
읽기
2026년 4월 3일

OpenAI, 테크 토크쇼 TBPN 인수 — AI 기업 최초 미디어 직접 소유

OpenAI가 Silicon Valley 창업자·투자자 커뮤니티에서 인기 높은 테크/비즈니스 토크쇼 TBPN(Technology Business Programming Network)을 인수했다. 주요 AI 기업으로는 최초의 미디어 업체 직접 인수다.

OpenAI
AI
읽기
2026년 4월 3일

Anthropic-호주 MOU 체결 — AI Safety Institute와 정식 안전 평가 협력

Anthropic이 2026년 3월 31일 호주 정부와 AI 안전 연구 및 국가 AI 계획 지원을 위한 MOU를 체결했다. Anthropic은 호주 AI Safety Institute와 공동 평가를 수행하고, Economic Index 데이터를 제공하며, 호주 연구기관 4곳에 총 AUD 300만 규모의 Claude API 크레딧을 지원한다.

AI
Claude
읽기
2026년 4월 3일

GitHub Copilot CLI /fleet 공개 — 병렬 서브에이전트로 코드 작업 동시 실행

GitHub가 2026년 4월 1일 Copilot CLI의 /fleet 기능을 공개했다. 이 기능은 하나의 작업을 여러 하위 작업으로 분해한 뒤, 서로 독립적인 파일·모듈 단위 작업을 병렬 서브에이전트에 배분해 동시에 실행한다.

AI
개발도구
읽기
2026년 4월 3일

Microsoft, MAI 모델 3종 출시 — Foundry를 독자 멀티모달 모델 유통 채널로 본격 전환

Microsoft가 2026년 4월 2일 MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2를 공개했다. 세 모델은 Microsoft Foundry와 MAI Playground에서 즉시 사용 가능하며, MAI-Transcribe-1은 상위 25개 언어 대상 음성 인식, MAI-Voice-1은 1초에 60초 분량 음성 생성, MAI-Image-2는 Copilot과…

AI
모델
읽기
2026년 4월 3일

Mistral, $8.3억 부채 조달 — 유럽 독자 AI 컴퓨트 확보에 본격 베팅

프랑스 AI 기업 Mistral이 2026년 3월 30일 파리 인근 데이터센터 구축을 위해 8억3000만 달러의 부채를 조달했다. 자금은 Nvidia 칩 13,800개 구매와 Bruyères-le-Châtel 데이터센터 구축에 투입되며, 센터는 2026년 2분기 가동이 목표다.

AI
산업
읽기
2026년 4월 3일

NVIDIA Mission Control 3.0 공개 — AI 팩토리 운영 KPI를 ‘GPU 활용률’에서 ‘token per watt’로 전환

NVIDIA가 2026년 4월 1일 Mission Control 3.0을 발표했다. 새 버전은 API 기반 모듈형 아키텍처, 다중 조직 격리, 전력 스케줄링, 예측형 AIOps를 결합해 대규모 AI 팩토리 운영을 소프트웨어 정의 방식으로 관리하도록 설계됐다.

AI
개발도구
읽기
2026년 4월 2일

Alibaba Qwen3.6-Plus 공개 — 1M 컨텍스트·에이전트 코딩, Claude Opus 4.5 수준 달성

Alibaba가 2026년 4월 2일 Qwen3.6-Plus를 공개했다. 기본 1M 토큰 컨텍스트 윈도우와 멀티모달 네이티브 지원, 리포지토리 수준 코딩 에이전트 기능을 갖췄으며, SWE-bench와 Terminal-Bench 2.0에서 Anthropic Claude Opus 4.5와 동등한 성능을 기록했다.

AI
모델
읽기
2026년 4월 2일

Cisco, RSA 2026서 에이전트 AI 보안 프레임워크 DefenseClaw 공개 — Zero Trust를 AI 에이전트로 확장

RSA Conference 2026에서 Cisco가 AI 에이전트 전용 보안 프레임워크 DefenseClaw를 발표했다. Skills Scanner, MCP Scanner, AI Bill of Materials(AI BoM), CodeGuard를 통합한 오픈소스 프레임워크로, 기존 Zero Trust Access를 인간 직원이 아닌 AI 에이전트에게도 적용할 수 있도록 확장했다.

AI
트렌드
읽기
2026년 4월 2일

Google Gemini 3.1 Flash-Lite 출시 — Pro 대비 1/8 가격에 Gemini 2.5 Flash 동등 성능

Google이 Gemini 3.1 Flash-Lite를 개발자 프리뷰로 출시했다. 입력 $0.25/1M 토큰(Pro의 1/8 수준), 출력 $1.50/1M 토큰이며, Gemini 2.5 Flash 대비 Time to First Token 2.5배 향상, 출력 속도 45% 향상을 달성하면서 핵심 성능 지표에서는 Gemini 2.5 Flash와 동등하다.

AI
모델
읽기
2026년 4월 2일

vLLM Model Runner V2 출시 — Prefill-Decode 분리 스케줄링으로 오픈소스 LLM 추론 아키텍처 혁신

2026년 3월, vLLM 프로젝트가 Model Runner V2(MRV2)를 릴리즈했다. 기존 스케줄러 아키텍처를 전면 재설계하여 Prefill-Decode 완전 분리 스케줄링과 Zero-Copy DMA 전송을 도입했다. HuggingFace 대비 24배 처리량을 유지하며 GitHub 스타 74,900개로 프로덕션 LLM 추론 엔진의 사실상 표준 위치를 공고히 했다.

AI
오픈소스
읽기
2026년 4월 2일

The Claude Code Source Leak: fake tools, frustration regexes, undercover mode

Anthropic은 실수로 npm 패키지에 소스 맵을 제공하여 전체 Claude Code 소스를 노출시켰습니다. 내부에서 찾은 내용은 다음과 같습니다.

트렌드
AI
읽기
2026년 4월 2일

Q1 2026 글로벌 VC $3,000억 사상 최고치 — AI가 전체 81% 독식, 단 4개 딜이 전체의 65% 차지

Crunchbase에 따르면 2026년 1분기 글로벌 벤처 투자가 $3,000억(약 410조 원)으로 사상 최고치를 기록했다. 전분기 대비 150% 이상 증가했으며, AI 기업이 전체의 81%인 $2,420억을 흡수했다. OpenAI($1,220억), Anthropic($300억), xAI($200억), Waymo($160억) 단 4개 딜이 전체의 65%를 차지했다.

AI
트렌드
읽기
2026년 4월 2일

캘리포니아 Newsom, 미국 최초 주정부 AI 안전 행정명령 서명 — 주계약 AI 기업에 안전·프라이버시 가이드라인 의무화

캘리포니아 주지사 Gavin Newsom이 2026년 3월 30일 미국 주정부 최초로 AI 안전 행정명령을 서명했다. 주정부와 계약을 맺는 AI 기업은 안전·프라이버시·편향 방지 가이드라인을 의무 준수해야 하며, 120일 내 세부 AI 벤더 인증 체계가 수립된다.

AI
트렌드
읽기
2026년 4월 2일

Claw Code — Claude Code 소스 기반 Python/Rust 클린룸 재구현 프로젝트 (130k★)

Claude Code 소스 공개를 계기로 탄생한 클린룸 재구현 프로젝트. Python + Rust로 에이전트 하네스 아키텍처를 재구현했다. 출시 2시간 만에 50k 스타, 현재 130k 스타 / 102k 포크. Sigrid Jin이 발기인.

트렌드
오픈소스
읽기
2026년 4월 1일

NVIDIA Nemotron 3 Super — 120B MoE 오픈소스 에이전트 모델, SWE-Bench 60.5% 달성

NVIDIA가 에이전트 워크로드 특화 오픈소스 모델 Nemotron 3 Super를 공개했다. Mamba-Transformer 하이브리드 MoE 아키텍처로 원래 1,200억 파라미터에서 활성 파라미터 120억만 사용, SWE-Bench Verified 60.47% 및 PinchBench 85.6%로 동급 오픈소스 최고 성능을 기록했다.

트렌드
오픈소스
읽기
2026년 4월 1일

Linux Foundation, MCP 기부 및 AAIF 출범 — AI 에이전트 표준화의 중립 거버넌스 시대 개막

Linux Foundation이 Anthropic의 MCP, Block의 goose, OpenAI의 AGENTS.md를 함칠 에이전틱 AI 파운데이션(AAIF)을 출범했다. AWS, Google, Microsoft, Cloudflare 등이 플래티덧 멤버로 참여하며, MCP는 특정 기업 소유가 아닌 인터넷 인프라 수준의 중립 표준 프로토콜로 전환된다.

트렌드
AI
읽기
2026년 4월 1일

Google TurboQuant — LLM KV 캐시 메모리 6배 압축, H100에서 8배 속도 향상

Google Research가 LLM의 KV 캐시 메모리를 6배 압축하면서 정확도 손실이 없는 알고리즘 TurboQuant를 공개했다. 16비트에서 3비트로의 훈련 없는(training-free) 압축으로 NVIDIA H100에서 최대 8배의 어텐션 연산 속도 향상을 달성하며, ICLR 2026 발표 예정이다.

트렌드
AI
읽기
2026년 4월 1일

OpenAI, $122B 펀딩 완료 — $852B 밸류에이션으로 IPO 전 최대 사모 투자 기록

OpenAI가 Amazon($50B), SoftBank($30B), NVIDIA($30B) 등 주요 투자자들로부터 $122B(약 174조원)를 조달해 밸류에이션 $852B(약 1,200조원)를 달성했다. 월 매출 $2B, 주간 활성 사용자 9억 명을 기록하며 IPO를 앞두고 있다.

트렌드
AI
읽기
2026년 4월 1일

Claude Code's source code has been leaked via a map file in their NPM registry

소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 1일

Anthropic Claude Code npm 패키징 오류로 51만 줄 소스코드 유출 — KAIROS 자율 데몬 모드·미공개 모델 코드네임 노출

2026년 3월 31일, @anthropic-ai/claude-code npm 패키지 v2.1.88에 내부 디버깅용 소스맵 파일이 실수로 포함되어 약 1,900개 TypeScript 파일(51만 2천 줄)이 공개됐다. GitHub에서 4만 1천 500회 이상 포크되며 확산됐고, Anthropic은 고객 데이터·자격증명 노출은 없었다고 공식 확인했다.

AI
Claude
읽기
2026년 4월 1일

Google TurboQuant, LLM KV 캐시 메모리 6배 압축·H100 속도 8배 향상 달성

Google Research가 ICLR 2026에서 발표할 TurboQuant를 공개했다. 별도 학습 없이 LLM의 KV 캐시를 3비트로 압축해 메모리를 6배 절감하고, NVIDIA H100에서 어텐션 연산 속도를 최대 8배 높이면서도 정확도 손실이 없다.

AI
트렌드
읽기
2026년 4월 1일

GPT-5.4 출시 — 추론·코딩·에이전트 통합 모델, OSWorld-V 인간 기준선 AI 최초 초과

OpenAI가 3월 5일 GPT-5.4를 출시했다. GPT-5.3 Codex의 코딩 역량을 메인라인 추론 모델에 통합한 것으로, 100만 토큰 컨텍스트 윈도우와 멀티스텝 에이전트 워크플로우 자율 실행 능력을 탑재했다. 실제 데스크톱 생산성 태스크를 시뮬레이션하는 OSWorld-V 벤치마크에서 75%를 기록, 인간 기준선(72.4%)을 AI 최초로 초과했다.

AI
모델
읽기
2026년 4월 1일

OpenAI, 최초 오픈웨이트 모델 gpt-oss-120b 공개 — Apache 2.0, o4-mini 수준 추론 성능

OpenAI가 처음으로 오픈웨이트 모델인 gpt-oss-120b(117B 파라미터, MoE)와 gpt-oss-20b를 Apache 2.0 라이선스로 공개했다. 단일 80GB GPU에서 실행 가능하며, 코딩·수학·툴 사용에서 o4-mini와 동등하거나 일부 초과한다.

AI
오픈소스
읽기
2026년 4월 1일

gstack — Garry Tan(YC 회장)이 만든 AI 소프트웨어 팩토리

Y Combinator 회장 Garry Tan이 만든 Claude Code 기반 AI 소프트웨어 팩토리. 23개의 전문화된 AI 역할(경영진, 엔지니어링, 디자인, QA, 보안 등)을 조합해 10~15개 스프린트를 병렬로 돌린다. 60일간 60만 줄 프로덕션 코드 산출, 일일 1~2만 줄 생산량. GitHub 스타 60.1k.

트렌드
오픈소스
읽기
2026년 4월 1일

Paperclip — AI 에이전트 팀을 회사처럼 운영하는 오케스트레이션 플랫폼

여러 AI 에이전트를 하나의 회사 조직처럼 구성하고 운영하는 오픈소스 오케스트레이션 플랫폼. 조직도, 목표 정렬, 예산 관리, 거버넌스(승인 게이트, 롤백, 감사 로그)까지 갖추고 있다. "OpenClaw이 직원이라면 Paperclip은 회사다." GitHub 스타 42.8k.

트렌드
오픈소스
읽기
2026년 3월 31일

Google TurboQuant — KV 캐시를 3비트로 6배 압축, 재학습 없이 H100에서 8배 처리량

Google의 TurboQuant가 ICLR 2026에서 발표될 예정이다. LLM의 KV 캐시를 3~4비트로 압축해 메모리를 4~6배 절감하면서 정확도 손실이 전혀 없고, H100 GPU에서 32-bit 대비 최대 8배 처리량 향상을 달성한다.

AI
모델
읽기
2026년 3월 31일

GPT-5.4 출시 — 컴퓨터 사용 에이전트로 인간 기준선(OSWorld 72%) 돌파

OpenAI는 3월 29일 GPT-5.4를 출시했다. 컴퓨터 사용(computer use)을 핵심 역량으로 탑재하여 OSWorld-Verified 벤치마크에서 75%를 기록, 인간 평균(72%)을 처음으로 추월했다.

AI
모델
읽기
2026년 3월 31일

Mistral Voxtral TTS — 4B 오픈소스 음성 합성 모델, ElevenLabs 대비 7~9배 저렴

Mistral AI가 3월 26일 오픈소스 텍스트-음성 변환 모델 Voxtral TTS(4B 파라미터)를 출시했다. 9개 언어를 지원하고 5초 이하의 음성 샘플로 목소리를 복제하며, 첫 오디오 출력 지연(TTFA)이 90ms에 불과해 실시간 음성 에이전트 구현이 가능하다.

AI
모델
읽기
2026년 3월 31일

NVIDIA Nemotron 3 Super — 120B Mamba-Transformer MoE 오픈 에이전트 모델, 이전 대비 5배 처리량

NVIDIA가 에이전트 AI 특화 오픈 모델 Nemotron 3 패밀리를 출시했다. 플래그십인 Nemotron 3 Super는 120B 파라미터(활성 12B)의 Mamba-Transformer MoE 하이브리드 아키텍처를 채택해 Nemotron 2 대비 5배 처리량을 달성하고 1M 토큰 컨텍스트 윈도우를 지원한다.

AI
모델
읽기
2026년 3월 31일

Cursor, 유료 개발자 100만 명 돌파 — 병렬 서브에이전트 & BugBot으로 AI 코딩 '5가데일' 재정의

AI 코드 에디터 Cursor가 유료 개발자 100만 명을 돌파하고, 2026년 3월 병렬 서브에이전트와 BugBot을 공식 출시했다. BugBot은 월 200만 건 이상의 PR을 자동 리뷰하며 70% 버그 해결률을 기록 중이다.

AI
개발도구
읽기
2026년 3월 31일

Google TurboQuant — LLM KV 캐시 3.5비트 압쳙으로 메모리 6배 절감, 오픈소스 공개

Google이 LLM의 KV-캐시를 채널당 3.5비트로 압쳙하는 오픈소스 양자화 기법 TurboQuant를 공개했다. 메모리 사용량을 최대 6배 줄이고 추론 속도를 대폭 향상시킨다.

AI
모델
읽기
2026년 3월 31일

OpenAI, $1,200억 역대 최대 평더링 완료 — Amazon $500억 주도, 기업가치 $7,300억 돌파

OpenAI가 Amazon $500억, Nvidia·SoftBank 각 $300억 등으로 구성된 총 $1,200억 평더링 라운드를 마무리했다. Pre-money 기업가치 $7,300억으로, 2026년 AI 산업 내 최대 단일 투자 이벤트다.

AI
OpenAI
읽기
2026년 3월 31일

Anthropic Mythos 유출 — 코딩·사이버보안 SOTA, "역량의 단계적 도약" 확인

Anthropicが내부 테스트 중이던 신규 모델 'Mythos(Claude Mythos/Opus 5)'가 데이터 유출로 공개됐다. 소프트웨어 코딩, 학술 추론, 사이버보안 영역에서 Claude Opus 4.6 대비 "극적으로 높은 점수"를 기록한 것으로 알려졌다.

AI
모델
읽기
2026년 3월 31일

MCP 9,700만 설치 돌파 — AI 에이전트 인프라 표준으로 안착, 그러나 보안 위협도 급부상

Anthropicの Model Context Protocol(MCP)이 2026년 3월 25일 기준 9,700만 설치를 달성했다. OpenAI, Google DeepMind, Cohere, Mistral 등 주요 AI 제공업체 모두 자사 에이전트 프레임워크에 MCP 지원을 통합 완료했다.

AI
API
읽기
2026년 3월 30일

Alibaba Qwen 3.5 소형 모델 공개 — 9B 파라미터로 GPT-OSS-120B 능가, Apache 2.0 오픈소스

Alibaba가 0.8B, 2B, 4B, 9B 파라미터 4종의 Qwen 3.5 소형 모델을 Apache 2.0 라이선스로 공개했다. 9B 모델이 GPQA Diamond 벤치마크에서 81.7점을 기록해 GPT-OSS-120B(71.5점)를 13.6% 앞질렀다.

AI
모델
읽기
2026년 3월 30일

Google TurboQuant, LLM KV 캐시 메모리 6배 절감 — 3-bit 양자화로 H100에서 8배 속도 향상

Google Research가 공개한 TurboQuant는 3-bit 벡터 양자화 기법을 통해 LLM의 KV 캐시 메모리를 6배 줄이면서 H100 GPU에서 최대 8배 추론 속도 향상을 달성했다. 정확도 손실 없이 이를 구현한 점이 핵심이다.

AI
모델
읽기
2026년 3월 30일

Mistral Small 4 (22B), 오픈소스 추론 벤치마크 1위 — 자기 3~5배 규모 클로즈드 모델 추월

프랑스 Mistral AI가 공개한 22B 파라미터의 Mistral Small 4가 추론 및 지시 수행 벤치마크에서 자신보다 3~5배 큰 클로즈드 모델들을 앞질렀다. Apache 2.0 라이선스로 제공되며 상업적 이용도 자유롭다.

AI
모델
읽기
2026년 3월 30일

OpenAI, $1100억 투자 유치 — $7300억 밸류에이션, 연 매출 $250억 돌파로 AI 경제 새 이정표

OpenAI가 SoftBank($300억), NVIDIA($300억), Amazon($500억) 등으로부터 총 $1,100억 규모의 신규 투자를 유치하며 기업가치 $7,300억을 기록했다. 연간 반복 매출(ARR)도 $250억을 돌파해 출시 3년 만에 사상 최대 AI 기업으로 굳어졌다.

AI
OpenAI
읽기
2026년 3월 30일

Yann LeCun의 AMI Labs, 유럽 역대 최대 시드 $10.3억 조달 — NVIDIA·베이조스 익스피디션 참여

튜링상 수상자 Yann LeCun이 설립한 Advanced Machine Intelligence(AMI) Labs가 유럽 역사상 최대 시드 라운드인 $10.3억을 $35억 밸류에이션으로 유치했다. NVIDIA, Bezos Expeditions, Temasek이 참여했다.

AI
모델
읽기
2026년 3월 30일

Anthropic, 데이터 누출로 공개된 차세대 모델 'Claude Mythos' — 사이버보안 역사상 가장 강력한 AI

Anthropicが 비보안 데이터 캐시를 통해 실수로 유출된 내부 코드명 'Capybara'(공개명 Claude Mythos)는 현존 최고 모델인 Claude Opus 4.6 대비 코딩·추론·사이버보안 모든 벤치마크에서 급격한 성능 향상을 보이는 차세대 최대급 모델이다.

AI
Claude
읽기
2026년 3월 30일

Google TurboQuant, LLM KV 캐시 6배 압축 — 재학습 없이 H100에서 8배 처리량 향상

Google Research가 ICLR 2026에서 발표한 TurboQuant는 LLM 추론의 가장 큰 메모리 병목인 KV 캐시를 3~4비트로 압축해 메모리 사용량을 최대 6배 절감하는 알고리즘으로, 재학습이나 파인튜닝 없이 적용 가능하며 품질 손실이 사실상 없다.

AI
모델
읽기
2026년 3월 30일

OpenAI, Sora 앱 및 API 완전 종료 — 하루 $100만 적자에 500만 이하 사용자로 붕괴한 AI 비디오 경제학

OpenAI가 2026년 3월 24일 Sora 앱과 Sora.com 서비스를 종료한다고 발표했다. Sora는 하루 약 $100만의 컴퓨팅 비용을 소모하면서 누적 인앱 결제 수익은 $210만에 그쳤고, 피크 사용자 수 100만을 기록한 이후 50만 이하로 붕괴했다.

AI
OpenAI
읽기
2026년 3월 30일

Anthropic 'Claude Mythos(Capybara)' 유출 — Opus 4.6 대비 코딩·추론·사이버보안 SOTA, 전례 없는 보안 리스크 공식 경고

Anthropic이 내부 테스트 중이던 차세대 모델 'Claude Mythos(코드명 Capybara)'의 상세 스펙이 unsecured 데이터 스토어를 통해 공개적으로 유출됐다. Anthropic은 이를 '현재까지 개발한 가장 강력한 모델'로 규정하며 코딩·학술 추론·사이버보안 벤치마크에서 Claude Opus 4.6 대비 드라마틱한 수치 향상을 확인했다고 밝혔다.

AI
Claude
읽기
2026년 3월 30일

ARC-AGI-3 출시 — 인간 100% vs 최고 AI 0.37%, 진정한 적응 학습을 요구하는 새로운 AGI 벤치마크

François Chollet과 Mike Knoop의 ARC Prize 재단이 ARC-AGI-3를 공개했다. 135개의 오리지널 인터랙티브 환경으로 구성된 이 벤치마크에서 인간은 100%를 달성한 반면, 최고 성능 AI인 Gemini 3.1 Pro는 고작 0.37%에 그쳤다 — GPT-5.4는 0.26%, Claude Opus 4.6은 0.25%다.

AI
트렌드
읽기
2026년 3월 30일

MCP, 월 9700만 다운로드 돌파 — 16개월 만에 React 수준 생태계, AI 에이전트 필수 인프라로 공식화

Model Context Protocol(MCP) SDK의 월간 다운로드가 2026년 3월 기준 9700만 건을 돌파했다. 2024년 11월 Anthropic이 출시했을 당시 약 200만 건이었던 수치가 16개월 만에 4,750% 성장한 것으로, React npm 패키지가 1억 다운로드에 도달하는 데 걸린 3년 대비 절반의 시간이다.

AI
트렌드
읽기
2026년 3월 30일

Mistral Small 4 출시 — 119B MoE (활성 6.5B), Apache 2.0, 추론·멀티모달·코딩 단일 모델 통합

Mistral AI가 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 총 119B 파라미터의 MoE 아키텍처로 활성 파라미터는 6.5B에 불과하지만, 기존에 별도 모델로 운용하던 Magistral(추론), Pixtral(멀티모달), Devstral(에이전트 코딩) 세 가지 역량을 256K 컨텍스트 창 하나로 통합했다.

AI
오픈소스
읽기
2026년 3월 29일

Google AI Studio, Antigravity 에이전트 + Firebase로 풀스택 바이브 코딩 환경 출시

Google이 2026년 3월 18일 AI Studio에 Antigravity 코딩 에이전트와 Firebase 백엔드를 통합한 풀스택 바이브 코딩 환경을 공개했다. 자연어 프롬프트 하나로 Firestore DB, Firebase Authentication, Cloud Run 배포까지 자동 구성되는 프로덕션 레디 앱 생성이 가능하다.

AI
개발도구
읽기
2026년 3월 29일

OpenAI, Sora 공식 종료 — 일 $1,500만 적자 끝에 컴퓨트 자원 로보틱스로 전면 재배치

OpenAI가 2026년 3월 24일 AI 영상 생성 서비스 Sora를 공식 종료했다. 서비스 전체 누적 매출이 $210만에 불과한 반면 일일 추론 비용은 약 $1,500만으로 구조적 적자가 지속됐으며, 해당 컴퓨트 자원은 로보틱스 및 세계 시뮬레이션 연구로 전면 재배치된다.

AI
OpenAI
읽기
2026년 3월 29일

Shopify Agentic Storefronts 전면 활성화 — 5.6M 가맹점, ChatGPT·Gemini·Copilot에서 기본 판매 시작

Shopify가 미국 내 5.6M 이상의 가맹점을 대상으로 ChatGPT, Google AI Mode, Microsoft Copilot, Gemini 앱 내 직접 상품 노출을 기본 활성화했다. 2026년 3월 24일부터 별도 설정 없이 Shopify 가맹점의 제품이 AI 대화 채널에 자동 노출되며, 구매는 가맹점 스토어로 연결된다.

AI
트렌드
읽기
2026년 3월 29일

AI 스타트업, 벤처 캐피털의 41% 독식 — $128B 시장에서 역대 최고 점유율

TechCrunch에 따르면 2026년 3월 현재 AI 스타트업이 전체 VC 투자($128B)의 41%를 흡수하며 역대 최고치를 기록했다. 3월 초 2주 만에 $100M+ 라운드가 어느 비교 기간보다 많이 발생했으며, xAI $20B, OpenAI $110B, Anthropic $30B 등 메가라운드가 잇따랐다.

AI
트렌드
읽기
2026년 3월 29일

Alibaba Qwen 3.5 Small 시리즈 출시: 9B 모델이 GPT 120B를 벤치마크에서 앞질러

Alibaba가 Qwen 3.5 Small 시리즈(0.8B·2B·4B·9B)를 Apache 2.0 라이선스로 오픈소스 공개했다. 9B 모델의 GPQA 점수 81.7로 OpenAI의 GPT-OSS-120B(71.5)를 벤치마크에서 앞질렀다.

AI
오픈소스
읽기
2026년 3월 29일

Gartner: 2030년까지 1조 파라미터 LLM 추론 비용 90% 하락 예측

Gartner가 2030년까지 1조 파라미터 규모 LLM의 추론 비용이 2025년 대비 90% 이상 하락할 것으로 공식 예측했다. 하드웨어 개선, 모델 압축(양자화·증류), 추론 최적화 기술이 복합적으로 작용하는 결과다.

AI
트렌드
읽기
2026년 3월 29일

Google TurboQuant: KV-cache 6배 압축으로 LLM 메모리 혁신, ICLR 2026 발표

Google이 ICLR 2026에서 TurboQuant를 발표했다. KV-cache를 채널당 3.5비트로 압축해 메모리 사용량을 6배 줄이는 소프트웨어 레벨의 LLM 효율화 기법이다.

AI
트렌드
읽기
2026년 3월 29일

Physical Intelligence, $11B 밸류에이션으로 $1B 펀딩 논의 중 — 로보틱스 AI 붐 정점

Ex-Google DeepMind 연구진이 창업한 Physical Intelligence(π)가 $11B 밸류에이션으로 $1B 투자 라운드를 협의 중이다. VLA(Vision-Language-Action) 모델 기반의 범용 로봇 제어 파운데이션 모델을 개발하고 있다.

AI
트렌드
읽기
2026년 3월 28일

SoftBank, OpenAI 지분 확대 위해 역대 최대 $400억 브릿지론 조달 — IPO 시그널 주목

SoftBank가 OpenAI의 $1,100억 라운드 투자 약정($300억) 이행을 위해 JPMorgan, Goldman Sachs, 미즈호, SMBC, MUFG 등 5개 은행으로부터 12개월 만기 $400억 무담보 브릿지론을 조달했다. 만기는 2027년 3월로 OpenAI IPO 예상 윈도우와 정확히 일치한다.

AI
OpenAI
읽기
2026년 3월 28일

Apple, iOS 27에서 Siri에 Claude·Gemini 통합 — 멀티모델 AI 플랫폼으로 전환 선언

Apple이 iOS 27에서 Siri를 경쟁 AI 어시스턴트(Google Gemini, Anthropic Claude 포함)에 개방하고, 질문을 다양한 AI 프로바이더로 라우팅하는 멀티모델 전략을 발표했다. 동시에 Siri 자체도 화면 인지 및 맥락 기반 응답 기능을 대폭 강화한다.

AI
트렌드
읽기
2026년 3월 28일

Google TurboQuant: LLM KV-Cache 6배 압축 달성, 메모리 반도체 시장 직격

Google이 ICLR 2026에서 발표한 TurboQuant 양자화 기술은 LLM의 KV-Cache를 채널당 3.5비트로 압축하여 메모리 사용량을 최대 6배 감소시키면서도 모델 품질을 유지("absolute quality neutrality")하는 데 성공했다. 이 결과로 Micron 등 AI 메모리 공급업체 주가가 즉각 하락했다.

AI
모델
읽기
2026년 3월 28일

Harvey, $2억 투자 유치 — 법률 AI 밸류에이션 $110억으로 버티컬 AI 전성시대 개막

법률 AI 스타트업 Harvey가 신규 $2억 라운드를 $110억 밸류에이션으로 마감했다. 이는 파운데이션 모델 레이어가 아닌 특정 버티컬 산업에 집중한 AI 애플리케이션 기업이 메가캡 평가를 받는 사례로, VC 자금이 수직 계열화(vertical specialization)로 이동하고 있음을 보여준다.

AI
트렌드
읽기
2026년 3월 28일

Mistral Small 4 (22B, Apache 2.0): 자신보다 3~5배 큰 클로즈드 모델 추론 성능 압도

Mistral AI가 220억 파라미터 규모의 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 추론 및 지시 수행 벤치마크에서 파라미터 수가 3~5배 많은 클로즈드 모델 여러 개를 상회하는 성능을 보였다.

AI
모델
읽기
2026년 3월 28일

Yann LeCun의 AMI Labs, 유럽 최대 시드 $10.3억 조달 — JEPA 월드모델로 Transformer 패러다임에 정면 도전

Meta AI 수석 과학자 Yann LeCun이 설립한 AMI Labs가 유럽 역사상 최대 시드 라운드인 $10.3억을 조달했다. Bezos, Nvidia, Samsung, Temasek이 참여했으며, 목표는 JEPA(Joint Embedding Predictive Architecture) 기반의 월드모델(world model)을 구축하는 것이다.

AI
모델
읽기
2026년 3월 27일

GitHub Copilot, 4월 24일부터 사용자 코드 데이터를 AI 훈련에 기본 활용 (opt-in 전환)

GitHub이 3월 25일 개인정보처리방침을 개정, 2026년 4월 24일부터 Copilot Free/Pro/Pro+ 사용자의 인터랙션 데이터(입력·출력 코드, 커서 주변 콘텐츠, 파일 구조, 탐색 패턴, 피드백 포함)를 기본 opt-in으로 AI 훈련에 활용한다고 발표했다. Copilot Business·Enterprise 사용자는 적용 제외다.

트렌드
AI
읽기
2026년 3월 27일

Google TurboQuant — LLM KV 캐시 6배 압축, 정확도 손실 제로 달성 (ICLR 2026)

Google이 LLM의 KV 캐시를 기존 16비트에서 3비트로 압축해 메모리 사용량을 최소 6배 줄이면서도 정확도 손실이 없는 알고리즘 TurboQuant를 공개했다. ICLR 2026에서 정식 발표 예정이며, H100 GPU에서 4비트 적용 시 32비트 대비 최대 8배 추론 성능 향상이 확인됐다.

트렌드
AI
읽기
2026년 3월 27일

ARC-AGI-3 출시 — 프론티어 모델 전부 1% 미만, AGI와의 간극 재확인

ARC Prize가 3월 25일 ARC-AGI-3을 공식 출시했다. 텍스트 지시 없이 낯선 환경을 탐색하며 목표를 스스로 설정해야 하는 인터랙티브 추론 과제로 구성되며, 인간은 100% 해결하는 반면 GPT-5.4(0.26%), Claude Opus 4.6(0.25%), Gemini 3.1 Pro(0.37%), Grok-4.20(0.00%) 등 최상위 프론티어 모델은 모두 1% 미만을…

트렌드
AI
읽기
2026년 3월 27일

Cursor, ARR $2B 달성 — 3개월 만에 매출 2배, SaaS 역사상 최단 스케일업

AI 코딩 도구 Cursor(Anysphere)가 출시 24개월 만에 ARR $1B을 돌파한 데 이어 2026년 3월 기준 ARR $2B을 달성했다. 단 3개월 만에 매출이 2배가 된 셈으로, $50B 기업가치를 목표로 후속 투자 라운드를 준비 중인 것으로 알려졌다.

AI
트렌드
읽기
2026년 3월 27일

Google TurboQuant, LLM KV 캐시 6배 압축 — 정확도 손실 0%

Google Research가 LLM의 KV(Key-Value) 캐시를 3비트로 압축해 메모리를 6배 절감하면서도 정확도 손실이 전혀 없는 알고리즘 TurboQuant를 공개했다. Nvidia H100 기준 Attention 연산 속도 최대 8배 향상을 기록하며 ICLR 2026에 채택됐다.

AI
트렌드
읽기
2026년 3월 27일

Mistral Small 4 출시 — 119B MoE, 추론·비전·코딩 통합 오픈소스 모델 (Apache 2.0)

Mistral AI가 2026년 3월 16일, 119B 파라미터 Mixture-of-Experts 아키텍처의 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 토큰당 활성 파라미터는 6B으로, 기존 Magistral(추론), Pixtral(비전), Devstral(에이전트 코딩) 세 모델의 기능을 하나로 통합했다.

AI
오픈소스
읽기
2026년 3월 27일

Mistral Voxtral TTS 공개 — 5초 샘플로 음성 복제, 9개 언어 엣지 배포 가능

Mistral AI가 2026년 3월 26일 오픈소스 TTS(텍스트-음성 변환) 모델 Voxtral TTS를 공개했다. Ministral 3B 기반으로 영어·프랑스어·독일어 등 9개 언어를 지원하며, 5초 미만의 음성 샘플로 커스텀 음성 복제가 가능하다. 첫 음성까지 지연(TTFA)은 90ms, 실시간 팩터(RTF)는 6x를 달성했다.

AI
오픈소스
읽기
2026년 3월 27일

Nvidia GTC 2026: 에이전트 AI 시대 선언 — NemoClaw·Agent Toolkit 오픈소스 공개

Nvidia GTC 2026에서 Jensen Huang은 AI 패러다임이 '프롬프트-응답' 챗봇에서 자율적으로 계획하고 행동하는 에이전트로 전환됐음을 선언했다. 에이전트 보안 레이어 NemoClaw와 오픈소스 에이전트 개발 플랫폼 NVIDIA Agent Toolkit을 공개하며, Salesforce·SAP·Adobe·ServiceNow 등 주요 엔터프라이즈 파트너와의 생태계를 구축했다.

AI
트렌드
읽기
2026년 3월 26일

AI 개발 도구, '어시스턴트'에서 '자율 에이전트'로 전환 가속 — March 2026 생태계 동향

Gemini CLI(Google), n8n 네이티브 AI 에이전트 빌더, Dapr Agents v1.0 등 자율 실행 가능한 에이전트형 개발 도구들이 2026년 3월을 기점으로 일제히 프로덕션 단계로 진입했다. 코드 자동완성을 넘어 복잡한 멀티스텝 워크플로우를 자율 실행하는 패러다임 전환이 선명해지고 있다.

AI
개발도구
읽기
2026년 3월 26일

Alibaba Qwen 3.5 Small: 9B 모델이 GPT-oss-120B를 GPQA Diamond에서 추월

Alibaba가 0.8B, 2B, 4B, 9B 네 가지 크기의 Qwen 3.5 Small 시리즈를 Apache 2.0 라이선스로 공개했다. 텍스트, 이미지, 비디오를 네이티브 멀티모달로 처리하며, 9B 모델이 GPQA Diamond 벤치마크에서 81.7점을 기록해 GPT-oss-120B(71.5점)를 상회했다.

AI
오픈소스
읽기
2026년 3월 26일

Dapr Agents v1.0 GA: 프로덕션 AI 에이전트의 Kubernetes 클라우드 네이티브 표준

CNCF(Cloud Native Computing Foundation)가 KubeCon + CloudNativeCon Europe 2026(암스테르담)에서 Dapr Agents v1.0 정식 출시를 발표했다. NVIDIA와 오픈소스 커뮤니티가 1년간 협업한 이 Python 프레임워크는 내구성 있는 워크플로우 엔진, 상태 관리, 안전한 멀티 에이전트 조율 기능을 제공한다.

AI
개발도구
읽기
2026년 3월 26일

Google TurboQuant: LLM KV 캐시 6배 압축, 정확도 손실 제로 달성

Google 리서치팀이 LLM의 KV(Key-Value) 캐시를 6배 압축하면서도 정확도 손실이 전혀 없는 새로운 양자화 알고리즘 TurboQuant를 공개했다. NVIDIA H100 GPU 기준 어텐션 연산 속도를 최대 8배 향상시키며, 재학습이나 파인튜닝 없이 즉시 적용 가능하다.

AI
모델
읽기
2026년 3월 26일

OpenAI, GPT-oss-120B/20B 오픈 웨이트 모델 Apache 2.0으로 공개

OpenAI가 GPT-oss-120B(MoE, 활성 파라미터 5.1B)와 GPT-oss-20B 두 모델을 Apache 2.0 라이선스로 Hugging Face에 공개했다. GPT-oss-120B는 단일 80GB GPU(H100, MI300X)에서 실행 가능하며, 핵심 추론 벤치마크에서 o4-mini에 근접하는 성능을 기록한다.

AI
오픈소스
읽기
2026년 3월 26일

Anthropic Economic Index 3월 보고서 — AI 사용자 학습곡선과 경제적 영향 분석

Anthropic이 Claude 사용 패턴 기반 경제 인덱스 3월 보고서를 발표했다. 핵심 발견은 장기 사용자(6개월+)가 신규 사용자 대비 4~5%p 높은 성공률을 보이며, 더 복잡한 고부가가치 작업에 AI를 활용한다는 것. 동시에 전체 사용자 풀은 저숙련·개인용 방향으로 확대되는 양극화가 진행 중.

트렌드
AI
읽기
2026년 3월 26일

Anthropic, 장시간 AI 앱 개발을 위한 Harness Design 패턴 공개

Anthropic이 Claude가 장시간(최대 6시간) 복잡한 앱을 자율적으로 빌드할 때 품질을 유지하기 위한 멀티 에이전트 하네스(Harness) 설계 패턴을 공개했다. GAN에서 영감받은 생성자-평가자 분리 구조로, Planner → Generator → Evaluator 3단 파이프라인을 통해 단일 에이전트 대비 압도적 품질 향상을 입증.

트렌드
AI
읽기
2026년 3월 23일

Claude Skills 2.0 - AI 에이전트 스킬 시스템 대규모 업그레이드

Claude Code 2.1.0에서 Skills 시스템이 대폭 개편됨. Frontmatter 지원, Forked Context(격리 실행), Hot Reload(실시간 반영), Agent-Scoped Hooks, Skill Creator 도구 등이 추가되어 스킬이 단순 프롬프트에서 프로그래밍 가능한 에이전트로 진화함.

트렌드
읽기
2026년 3월 20일

Autoresearch - Karpathy의 AI 자동 LLM 훈련 실험 프레임워크

AI 에이전트가 자율적으로 LLM 훈련 실험을 수행하는 프레임워크. 5분 단위 훈련 후 성능 평가/반복. 수면 중 ~100회 실험 가능. GitHub 43.9k⭐

트렌드
오픈소스
읽기
2026년 3월 11일

A GitHub Issue Title Compromised 4k Developer Machines

GitHub 문제에 대한 즉각적인 주입으로 연쇄 반응이 발생하여 4,000명의 개발자가 동의 없이 OpenClaw를 설치하게 되었습니다. 이 공격은 잘 알려진 취약점을 새로운 것으로 구성합니다. 하나의 AI 도구가 다른 AI 도구를 부트스트랩합니다.

트렌드
AI
읽기
2026년 3월 10일

LLMs work best when the user defines their acceptance criteria first

데이터베이스에서 실행할 수 있는 가장 간단한 테스트 중 하나는 다음과 같습니다.

트렌드
AI
읽기
2026년 3월 9일

The L in "LLM" Stands for Lying

AI 사용의 불가피성에 대한 질문

트렌드
AI
읽기
2026년 3월 8일

Tell HN: I'm 60 years old. Claude Code has re-ignited a passion

Tell HN: I'm 60 years old. Claude Code has re-ignited a passion | Hacker News 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 3월 7일

Dario Amodei calls OpenAI’s messaging around military deal ‘straight up lies’

Anthropic은 AI 안전 불일치로 인해 국방부와의 계약을 포기했습니다. 그러자 OpenAI가 급습했습니다.

트렌드
AI
읽기
2026년 3월 6일

GPT-5.4

GPT-5.4 소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 3월 5일

Claude's Cycles [pdf]

Claude's Cycles [pdf] 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 3월 5일

Claude Code Hooks - 에이전트 라이프사이클 제어 시스템

Claude Code의 라이프사이클 이벤트에 사용자 정의 명령을 실행하는 Hooks 시스템. Command/Prompt/Agent 3가지 핸들러 타입과 PreToolUse, PostToolUse 등 라이프사이클 이벤트 지원.

트렌드
읽기
2026년 3월 4일

How do I cancel my ChatGPT subscription?

How do I cancel my ChatGPT subscription? 소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 3월 3일

We do not think Anthropic should be designated as a supply chain risk

소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 3월 2일

OpenAI – How to delete your account

OpenAI – How to delete your account 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 3월 1일

OpenAI agrees with Dept. of War to deploy models in their classified network

소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 2월 28일

How will OpenAI compete?

OpenAI에는 몇 가지 큰 질문이 있습니다. 독특한 기술은 없습니다. 사용자 기반은 크지만 참여도와 끈기가 제한적이고 네트워크 효과가 없습니다. 기존 기업은 기술과 일치하며 제품과 유통을 활용하고 있습니다. 그리고 많은 가치와 영향력은 새로운 경험에서 나올 것입니다.

트렌드
AI
읽기
2026년 2월 27일

Google API keys weren't secrets, but then Gemini changed the rules

Google은 개발자들에게 Google API 키(예: 지도, Firebase 등에 사용되는 키)가 비밀이 아니라는 사실을 알리는 데 10년 넘게 시간을 보냈습니다. 그러나 그것은 더 이상 사실이 아닙니다.

트렌드
AI
읽기
2026년 2월 26일

Claude Code Remote Control

원격 제어를 사용하여 휴대폰, 태블릿 또는 브라우저에서 로컬 Claude Code 세션을 계속하세요. clude.ai/code 및 Claude 모바일 앱과 함께 작동합니다.

트렌드
AI
읽기
2026년 2월 26일

MiniMax M2.5 - 오픈소스 AI 모델, Claude Opus 4.6의 1/20 비용

230B 파라미터 MoE 모델(10B 활성). SWE-Bench 80.2%로 Claude Opus 4.6에 근접. 비용은 1/20 수준. 오픈소스(MIT 라이선스).

트렌드
오픈소스
읽기
2026년 2월 26일

Origami.chat - AI 기반 대화형 종이접기

종이접기를 AI와 대화하며 배우는 인터랙티브 플랫폼. 실시간 3D 미리보기와 단계별 가이드 제공. Product Hunt 1위 (372표).

트렌드
무료
읽기
2026년 2월 25일

“Car Wash” test with 53 models

신뢰할 수 있는 에이전트를 위한 개발자 플랫폼

트렌드
AI
읽기
2026년 2월 25일

Discord cuts ties with Peter Thiel–backed verification software after its code was found tied to U.S. surveillance efforts

Discord는 유출된 코드가 70,000명의 사용자를 덮친 지 몇 달 만에 연방 보고에 대한 우려를 불러일으킨 후 연령 확인 파트너와의 관계를 끊었습니다.

트렌드
AI
읽기
2026년 2월 25일

Show HN: Micasa – track your house from the terminal

micasa — your house, in a terminal 소식의 핵심을 빠르게 정리하면, 개발 도구 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 2월 25일

Why is Claude an Electron app?

코드가 무료라면 모든 앱이 기본이 아닌 이유는 무엇입니까?

트렌드
AI
읽기
2026년 2월 25일

OpenAI has deleted the word 'safely' from its mission

OpenAI의 구조 조정은 사회가 인류에게 이익을 제공하고 해를 끼칠 가능성이 있는 조직의 업무를 어떻게 감독하는지에 대한 테스트 사례가 될 수 있습니다.

트렌드
AI
읽기
2026년 2월 24일

Anthropic officially bans using subscription auth for third party use

Legal agreements, compliance certifications, and security information for Claude Code.

트렌드
AI
읽기
2026년 2월 24일

How I use Claude Code: Separation of planning and execution

The research-plan-implement workflow I use to build software with Claude Code, and why I never let it write code until I've approved a written plan. (카테고리: 트렌드, HN 947점·댓글 580)

트렌드
AI
읽기
2026년 2월 23일

Gemini 3.1 Pro

3.1 Pro is designed for tasks where a simple answer isn’t enough. (카테고리: AI 모델, HN 961점·댓글 910)

트렌드
AI
읽기
2026년 2월 23일

Claude Sonnet 4.6

Claude Sonnet 4.6 is a full upgrade of the model’s skills across coding, computer use, long-reasoning, agent planning, knowledge work, and design. (카테고리: AI 모델, HN 1345점·댓글 1223)

트렌드
AI
읽기
2026년 2월 23일

Gemini 3 Deep Think

We’re releasing a major upgrade to Gemini 3 Deep Think, our specialized reasoning mode. (카테고리: AI 모델, HN 1080점·댓글 693)

트렌드
AI
읽기
2026년 2월 20일

Windows 메모장 원격 코드 실행 취약점 (1)

Windows 메모장에서 명령 주입 취약점 발견. CVSS 8.8. 30년간 단순 텍스트 뷰어였던 메모장에 네트워크 기능 추가로 인한 문제.

트렌드
읽기
2026년 2월 15일

CDP로 토큰 사용량 80% 줄이기 (MCP 대신 CDP 활용)

MCP는 매 턴 API 호출 후 context 누적으로 토큰 기하급수 증가. CDP(Chrome DevTools Protocol)는 스크립트 1회 작성+실행으로 context 누적 없이 동일 작업 수행. 블록 10개 기준 MCP 32,500 vs CDP 5,500 토큰(약 83% 절감). Notion/Figma/Slack/Cursor 등 Chromium 기반 앱에 적용 가능.

트렌드
무료
읽기
2026년 2월 13일

Windows 메모장 원격 코드 실행 취약점

Windows 메모장에서 명령 주입 취약점 발견. CVSS 8.8. 30년간 단순 텍스트 뷰어였던 메모장에 네트워크 기능 추가로 인한 문제.

트렌드
읽기
2026년 2월 10일

YouTube Sans - 브랜드 타이포그래피 케이스 스터디

Sharp Type이 YouTube를 위해 개발한 브랜드 전용 폰트. 2014년부터 개발, 309개 언어 지원, Variable Font 기술 적용.

트렌드
읽기
2026년 2월 10일

Playwright CLI - AI 코딩 에이전트용 브라우저 자동화

Microsoft의 브라우저 자동화 CLI. MCP 대신 CLI 기반으로 토큰 효율성 극대화. Claude Code, Copilot 등 코딩 에이전트에 최적화.

트렌드
오픈소스
읽기
2026년 2월 9일

BayesLab - AI 데이터 분석 에이전트

코딩 없이 데이터 클리닝부터 시각화, 리포트 생성까지 자동화하는 AI 분석 도구. 'Vibe Analytics' 콘셉트로 AI와 함께 분석.

트렌드
읽기
2026년 2월 9일

Claude Opus 4.6 출시 - 1M 토큰 컨텍스트 & Agent Teams

Anthropic의 최신 모델. 1M 토큰 컨텍스트(베타), 128k 토큰 출력, 적응형 사고, 컨텍스트 압축, Agent Teams 기능 추가.

트렌드
API
읽기
2026년 2월 9일

OpenClaw - 1인 개발자의 초고속 성장 AI 에이전트

1인 개발자 Peter Steinberger가 만든 오픈소스 AI 비서. WhatsApp/Telegram으로 컴퓨터 작업 자동화. GitHub 스타 18만개, 역대 최고속 성장.

트렌드
오픈소스
읽기
2026년 2월 6일

Claude Code Agent Teams - 멀티 에이전트 협업

Claude Code의 새 기능. 여러 에이전트가 병렬로 작업하고 서로 직접 소통하며 협업. 팀 리드가 조율하고 팀원들은 독립적으로 작업.

트렌드
오픈소스
읽기
2026년 2월 5일

Software Survival 3.0 - AI 시대 소프트웨어 생존법

Steve Yegge의 글. AI가 코드를 쓰는 시대에 소프트웨어가 생존하려면 '인지적 비용 대비 절약'이 높아야 한다는 'Squirrel Selection' 이론 제시.

트렌드
읽기
2026년 2월 5일

Pencil - IDE 내 AI 디자인 도구

Cursor, VS Code 등 IDE에서 디자인과 코드를 동시에 작업할 수 있는 AI 디자인 도구. MCP로 Claude Code와 연동, Figma 호환.

트렌드
읽기
2026년 2월 4일

AI 사용자, 두 부류로 나뉘다

AI 파워유저(Claude Code, MCP 활용)와 기업 제약으로 제한된 사용자 간의 격차가 커지고 있다는 분석. MS도 내부에선 Copilot 대신 Claude Code 사용 중.

트렌드
읽기
2026년 2월 3일

AI가 이미 인간 수준의 지능을 갖춘 것인가?

Nature에서 발행한 기사로, 앨런 튜링이 1950년대 제시한 인간 수준의 기계 지능 비전이 현실이 되었다고 주장. AI 능력에 대한 과대평가나 두려움 없이 냉철한 시각으로 미래를 준비해야 한다는 내용.

트렌드
읽기
2026년 2월 3일

claude-mem - Claude Code 영구 메모리

Claude Code를 위한 1줄 설치 메모리 시스템. 세션 간 컨텍스트 손실 방지. AI로 대화 압축 후 ChromaDB에 벡터 저장, 다음 세션에 자동 주입. 로컬 저장으로 프라이버시 보장. GitHub 12k 스타.

트렌드
오픈소스
읽기
2026년 2월 2일

Claude Code 팀 - 6개월 하드코어 사용 노하우

Reddit에서 화제된 Claude Code 6개월 사용 팀 모음. 자동 활성화 스킬, 전략적 계획 서브에이전트, 훅 시스템 등 엔터프라이즈급 워크플로우 구축법. GitHub 샘플 40시간만에 1,100 스타.

트렌드
무료
읽기
2026년 2월 2일

oh-my-ag - 멀티에이전트 개발 스킬

Google Antigravity IDE를 위한 멀티에이전트 스킬. PM/Frontend/Backend/Mobile/QA/Debug 에이전트가 협업. 토큰 75% 절감 설계. Gemini/Claude/Codex/Qwen 등 모델 혼합 사용. 실시간 대시보드. bunx oh-my-ag로 설치.

트렌드
오픈소스
읽기
2026년 1월 29일

AgenticSeek - 100% 로컬 AI 에이전트

Manus AI의 완전 로컬 대안. API 비용 없이 전기세만으로 자율 에이전트 실행. 웹 브라우징, 코드 작성/디버깅, 태스크 계획을 로컬 LLM으로 처리. 보이스 지원. GitHub 24.4k+ 스타.

트렌드
오픈소스
읽기
2026년 1월 29일

MiniMax Music - AI 음악 생성

MiniMax의 AI 음악 생성 플랫폼. Music 2.0으로 최대 5분 곡 생성, 초실감 보컬, 다중 악기 개별 컨트롤, 영화음악 스코어링 가능. 16개 스타일 × 11개 감정 × 10개 씨나리오. Suno/Udio 경쟁.

트렌드
API
읽기
2026년 1월 29일

Twin - AI 웹 자동화 에이전트

API 없이 웹 브라우저를 제어해 작업 자동화하는 AI 에이전트. 목표만 설정하면 스스로 경로 탐색, 버튼 클릭, 정보 입력. UI 변경 시 자동 적응. 베타 기간 4만+ 태스크, 9000+ 앱 지원. Qonto(50만 고객) 파트너십. OpenAI CUA 알파 테스터 15개사 중 하나.

트렌드
읽기
2026년 1월 29일

Mistral Vibe CLI - 오픈소스 코딩 에이전트

Mistral의 오픈소스(Apache 2.0) CLI 코딩 어시스턴트. Devstral 2(SWE-bench 72.2%) 기반. 터미널에서 자연어로 코드베이스 탐색/수정/실행. 프로젝트 컨텍스트 자동 인식, Git 상태 반영, 멀티파일 오케스트레이션. Claude Sonnet 대비 7배 비용 효율적. 현재 API 무료.

트렌드
오픈소스
읽기
2026년 1월 29일

Hunyuan 3D - Tencent 3D 생성 AI

Tencent의 AI 3D 생성 플랫폼. 텍스트/이미지/스케치로 고품질 3D 에셋 생성. 2단계 DiT 아키텍처(형태→텍스처 분리). 며칠 걸리던 작업을 분 단위로 단축. OBJ/GLB 출력, Unity/Unreal/Blender 호환. HuggingFace 260만+ 다운로드. 무료 20회/일 제공.

트렌드
오픈소스
읽기
2026년 1월 29일

Agentation - AI 코딩 네비게이터

AI 코딩 어시스턴트(Claude Code, Cursor, Windsurf 등)를 위한 UI 요소 주석 도구. 브라우저에서 요소 클릭 시 클래스명, CSS 셀렉터, 위치 정보를 자동 캡처. AI가 정확한 파일/라인으로 직접 점프 가능. '눈먼 장님 코딩' 문제 해결.

트렌드
무료
읽기
2026년 1월 28일

Alt - AI Lecture Notetaker

AI 강의 노트 서비스. 강의를 자동으로 전사(transcribe)하고, 요약하고, 구조화된 노트로 정리해줌. 검색 가능한 형태로 학습 콘텐츠를 관리. 현재 얼리 액세스 대기 중(waitlist).

트렌드
읽기
2026년 1월 28일

Script Is All You Need

[비디오 생성 AI] 스크립트 기반 비디오 생성 연구 프로젝트. 데모 페이지 확인 필요.

트렌드
읽기
2026년 1월 28일

Gemini 3 Flash - Agentic Vision

Google의 Gemini 3 Flash에 추가된 Agentic Vision 기능. 이미지를 단순히 '보는' 게 아니라 Think→Act→Observe 루프로 능동적으로 '조사'함. 코드 실행으로 이미지를 확대/크롭/분석하며 추론 근거를 시각적으로 제시. 비전 벤치마크에서 5-10% 성능 향상. GPQA Diamond 90.4%, SWE-bench 78% 달성.

트렌드
API
읽기
2026년 1월 28일

MiniMax Agent

중국 AI 스타트업 MiniMax의 AI 에이전트. 코딩, 분석, 멀티모달(이미지/영상/음성) 생성 지원. 100만 토큰 컨텍스트의 MiniMax-M1 모델 기반. 자연어로 복잡한 작업 수행 가능.

트렌드
API
읽기
읽을거리로 돌아가기