PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

주제

#AI

450개 읽을거리를 모았습니다.
2026년 6월 27일

AWS Lambda MicroVMs - serverless sandboxes target AI-generated code execution

AWS는 2026년 6월 22일 Lambda MicroVMs를 발표하며, 사용자 또는 AI가 생성한 코드를 isolated, stateful execution environment에서 실행할 수 있는 serverless compute primitive를 공개했다. Firecracker 기반 VM-level isolation, near-instant launch/resume,…

AI
개발도구
읽기
2026년 6월 27일

DeepSpec - speculative decoding becomes an open production optimization stack

DeepSeek은 speculative decoding draft model을 훈련하고 평가하기 위한 MIT-licensed DeepSpec repository를 공개했다. README 기준 DeepSpec은 data preparation, draft model implementation, training, evaluation scripts를 포함하며 DSpark, DFlash,…

AI
오픈소스
읽기
2026년 6월 27일

GPT-5.6 Sol preview - frontier model releases become policy-gated infrastructure decisions

OpenAI는 2026년 6월 26일 GPT-5.6 series의 limited preview를 발표하며 Sol, Terra, Luna 3개 tier와 새로운 max reasoning effort, subagent 기반 ultra mode를 공개했다. Sol은 Terminal-Bench 2.1, GeneBench v1, ExploitBench, ExploitGym 같은 장시간…

AI
OpenAI
읽기
2026년 6월 26일

General Intuition Series A - gameplay data becomes the next action-model training substrate

General Intuition은 Khosla Ventures가 lead한 3억 2천만 달러 Series A를 발표하며, 가상 및 물리 환경에서 perceive, predict, act할 수 있는 모델을 만들겠다고 밝혔다. 보도에 따르면 post-money valuation은 23억 달러이며, TechCrunch는 이번 라운드 이후 누적 공개 funding이 4억 5,400만 달러라고…

AI
산업
읽기
2026년 6월 26일

HF Jobs vLLM server - throwaway OpenAI-compatible endpoints get pay-per-second GPUs

Hugging Face는 HF Jobs에서 vLLM server를 한 번의 CLI 명령으로 띄워 private OpenAI-compatible LLM endpoint를 만들 수 있는 흐름을 공개했다. 서버 프로비저닝이나 Kubernetes 없이 pay-per-second GPU 인프라에서 테스트, eval, batch generation 용도로 빠르게 사용할 수 있다는 점을 전면에 내세웠다.

AI
개발도구
읽기
2026년 6월 26일

QHexRT - Qualcomm Hexagon NPU inference moves small LLMs fully on-device

RunAnywhereAI는 Qualcomm Hexagon NPU용 full-stack inference engine인 QHexRT를 공개했고, 첫 catalog entry로 Liquid AI의 LFM 2.5 230M을 지원한다. 발표는 decode graph, prefill graph, lm-head, embeddings까지 inference path의 모든 tensor가 HTP에 머무르며…

AI
개발도구
읽기
2026년 6월 25일

Claude Tag - Slack-native team agents move from private assistants to shared workspaces

Anthropic은 Slack에서 @Claude를 태그해 팀 단위로 작업을 위임하는 Claude Tag beta를 공개했다. Claude Enterprise와 Team 고객 대상이며, channel-scoped memory, tool/data/codebase access, ambient updates, spend limits, activity logs를 제공한다.

AI
Claude
읽기
2026년 6월 25일

GLM-5.2 - open long-context models push agentic coding toward 1M-token workspaces

Z.AI는 GLM-5.2를 공개하며 1M-token context, flexible effort levels, MIT license, long-horizon coding benchmark 성능을 전면에 내세웠다. 공개 글은 IndexShare로 1M context에서 per-token FLOPs를 2.9x 줄이고, Terminal Bench 2.1 81.0, SWE-bench Pro…

AI
모델
읽기
2026년 6월 25일

Microsoft AutoJack - browsing agents expose local MCP control planes to RCE

Microsoft Defender Security Research Team은 AutoGen Studio 개발 빌드에서 browsing agent가 악성 웹페이지를 렌더링하면 local MCP WebSocket을 통해 host process를 실행할 수 있는 AutoJack chain을 공개했다. 이 chain은 localhost origin trust, MCP path auth…

AI
개발도구
읽기
2026년 6월 24일

FFASR Leaderboard - voice AI benchmarks move from clean speech to far-field reality

Hugging Face와 Treble Technologies는 Far-Field ASR(FFASR) Leaderboard를 공개해 ASR 모델을 reverberation, background noise, competing speech, room acoustics 같은 실제 far-field 조건에서 비교할 수 있게 했다. 기존 clean/near-field benchmark 중심 평가가…

AI
모델
읽기
2026년 6월 24일

Kog Laneformer 2B - latency-first coding models move architecture into the serving layer

Kog는 Hugging Face에 Laneformer 2B의 weights와 model code를 공개했다. 이 모델은 2.3B parameter instruction-tuned coding model로, Delayed Tensor Parallelism과 lane-structured Transformer를 통해 batch-size-one decoding latency를 모델 아키텍처…

AI
모델
읽기
2026년 6월 24일

Krea 2 technical report - open image models compete on creative control, not only fidelity

Krea는 Krea 2 technical report를 공개하며 K2 Raw와 K2 Turbo 계열의 open-weights text-to-image foundation model을 설명했다. 보고서는 data curation, diffusion transformer architecture, multi-stage training, prompt expander, style-reference…

AI
모델
읽기
2026년 6월 24일

NVIDIA NeMo AutoModel - MoE fine-tuning gets a drop-in performance path for Transformers

NVIDIA와 Hugging Face는 Transformers v5 위에서 NeMo AutoModel을 사용해 MoE fine-tuning을 가속하는 방법을 공개했다. NeMo AutoModel은 Expert Parallelism, DeepEP fused all-to-all dispatch, TransformerEngine kernels를 추가해 같은 from_pretrained() 계열…

AI
개발도구
읽기
2026년 6월 23일

Fika Jobs - AI interview agents expose the product-risk tradeoff in hiring automation

TechCrunch는 Stockholm 기반 Fika Jobs가 AI interview agents와 short-form video profiles를 결합한 hiring platform으로 400만 달러 pre-seed를 유치했다고 보도했다. 후보자는 LinkedIn profile을 연결하고 Gemini 기반 agent가 생성한 약 10분 interview를 수행하며, Fika는 이를 짧은…

AI
에이전트
읽기
2026년 6월 23일

Google Jules evals - coding agents need insight-policy benchmarks, not just SWE-bench tasks

Google Developers Blog는 Jules 연구를 통해 proactive coding agent 평가가 단일 bug fix 성공률이 아니라 insight policy를 측정해야 한다고 주장했다. 내부 Google codebase의 705 bugs와 1,178 CLs를 이용해 related bug cluster를 aspirational goal로 재구성하고, agent가 3회…

AI
개발도구
읽기
2026년 6월 23일

huggingface_hub weekly release CI - open-weight agents make release automation auditable

Hugging Face는 huggingface_hub를 4-6주 주기에서 weekly release로 바꾼 GitHub Actions 기반 release pipeline을 공개했다. OpenCode, GLM-5.2 open-weight model, HF Inference Providers, PyPI Trusted Publishing을 사용하되, release notes와…

AI
오픈소스
읽기
2026년 6월 23일

OpenAI Patch the Planet - AI-assisted security needs maintainer-controlled remediation loops

OpenAI는 Trail of Bits와 함께 Patch the Planet을 공개해 cURL, NATS Server, pyca/cryptography, Sigstore, aiohttp, Go, Python 등 주요 OSS 프로젝트에 AI-assisted security research와 human expert review를 결합한다. Daybreak/Codex Security 흐름은…

AI
OpenAI
읽기
2026년 6월 22일

Intel XPU Kernel Skill - coding agents optimize Triton kernels beyond CUDA-first defaults

Intel DCG AI Software와 OCTO Parallel Computing Lab은 Hugging Face Kernel Hub용 Intel XPU Kernel Skill을 공개했다. Xe-Forge 기반 CoVeR loop는 LLM이 Triton kernel을 생성, 검증, benchmark, refine하도록 만들며 Arc Pro B70에서 KernelBench Level-2…

AI
개발도구
읽기
2026년 6월 22일

MosaicLeaks - deep research agents can leak private facts through harmless-looking searches

ServiceNow와 Hugging Face는 deep research agent가 private local documents와 web retrieval을 함께 사용할 때 외부 검색 쿼리만으로 민감 정보가 새는 MosaicLeaks 문제를 제시했다. 제안한 PA-DR training은 strict chain success를 48.7%에서 58.7%로 올리면서…

AI
에이전트
읽기
2026년 6월 22일

PP-OCRv6 on Hugging Face - document AI stays specialized, small, and multilingual

PaddlePaddle은 Hugging Face에서 PP-OCRv6를 공개하며 1.5M, 7.7M, 34.5M parameter의 tiny/small/medium OCR tier를 제공한다고 밝혔다. medium/small tier는 50개 언어를 지원하고, medium은 자체 multi-scenario benchmark에서 detection Hmean 86.2%, recognition…

AI
모델
읽기
2026년 6월 22일

Reflection-SpaceX compute deal - open-source frontier AI hits a capacity wall

Nvidia-backed Reflection AI가 SpaceXAI의 Colossus 2 compute에 접근하는 대형 계약을 체결한 것으로 보도됐다. 계약 구조는 2026년 7월 1일부터 2029년까지 월 1.5억 달러, 총 약 USD 6.3B 규모로 알려졌고, Reflection은 GB300급 compute를 확보해 open-source frontier model 경쟁을 이어가려 한다.

AI
산업
읽기
2026년 6월 21일

Arcade Series A — enterprise agents need an authorization layer, not just MCP gateways

Arcade.dev는 SYN Ventures 주도, Morgan Stanley와 Wipro 참여로 6,000만 달러 Series A를 유치해 누적 7,200만 달러를 확보했다고 발표했다. 회사는 production AI agent를 위한 secure action layer를 표방하며 authorization, reliability, governance를 핵심 문제로 제시한다.

AI
에이전트
읽기
2026년 6월 21일

Cloudflare Temporary Accounts — coding agents can deploy Workers without human signup flow

Cloudflare는 2026년 6월 19일 AI agents가 wrangler deploy --temporary로 계정 생성, OAuth, API token 발급 없이 Workers를 배포할 수 있는 Temporary Accounts 기능을 공개했다. 배포된 Worker는 60분 동안 유지되며, 사용자가 claim하면 영구 계정으로 전환할 수 있다.

AI
에이전트
읽기
2026년 6월 21일

GitHub Code Quality GA — code governance becomes subscription plus AI metering

GitHub는 Code Quality가 2026년 7월 20일 public preview에서 GA로 전환되며 유료 제품이 된다고 공지했다. 가격은 enabled repository의 active committer당 월 10달러에 AI-powered 기능 사용량 과금이 추가되고, deterministic CodeQL 분석은 GitHub Actions minutes를 소비한다.

AI
개발도구
읽기
2026년 6월 21일

NVIDIA Cannes AI marketing stack — agentic workflows move into campaign operations

NVIDIA는 Cannes Lions 2026 기간 Alembic, AWS, Criteo, Higgsfield, KERV.ai, Taboola 등이 NVIDIA infrastructure와 agent toolkit으로 광고·마케팅 AI를 운영 사례로 시연한다고 밝혔다. 사례에는 Criteo의 Blackwell 기반 약 2배 학습 속도 개선과 연 17,000 GPU hours 절감,…

AI
산업
읽기
2026년 6월 20일

Adani-Jabil AI infra alliance — AI 경쟁이 모델에서 전력·랙·제조 공급망으로 확장된다

Adani Group과 Jabil은 2026년 6월 15일 India에 vertically integrated AI and data center infrastructure manufacturing platform을 만들기 위한 strategic alliance intent를 발표했다. 목표는 multi-GW high-density AI rack, liquid-cooled server,…

AI
산업
읽기
2026년 6월 20일

Norway school AI restrictions — 초등 AI 금지가 교육용 AI 확산의 반작용을 보여준다

Reuters 보도에 따르면 Norway는 2026년 8월 새 학기부터 1~7학년(6~13세)의 generative AI 사용을 원칙적으로 금지하고, 14~16세는 교사 감독 아래 제한적으로 허용한다.

AI
트렌드
읽기
2026년 6월 20일

Salesforce-Fin acquisition — customer service agents가 CRM suite의 핵심 실행 계층으로 편입된다

Salesforce는 2026년 6월 15일 Intercom에서 분사·리브랜딩된 customer agent company Fin을 약 USD 3.6 billion에 인수하기로 했다고 발표했다. Fin의 AI Agent는 live chat, email, WhatsApp, SMS, phone, Slack을 포함한 support channel에서 end-to-end query…

AI
에이전트
읽기
2026년 6월 19일

Anthropic Public Record — 미국 대중은 AI 효용보다 책임성과 규제를 먼저 요구한다

Anthropic은 2026년 6월 12일 첫 Anthropic Public Record 결과를 공개했다. 2025년 11~12월 YouGov 기반으로 약 51,993명의 미국인을 조사한 결과, 64%가 AI로 인한 job loss를 우려했고 71%는 정부가 AI 개발·규제에 관여해야 한다고 답했다.

AI
Claude
읽기
2026년 6월 19일

ChatGPT Enterprise spend controls — AI 도입의 병목이 모델 접근에서 비용 거버넌스로 이동

OpenAI는 2026년 6월 18일 ChatGPT Enterprise에 credit usage analytics와 업데이트된 spend controls를 도입해 관리자에게 사용자·제품·모델별 사용량과 비용 가시성을 제공한다고 발표했다.

AI
OpenAI
읽기
2026년 6월 19일

MAI-Code-1-Flash 확장 — coding model 경쟁이 Copilot surface coverage로 이동

GitHub는 2026년 6월 18일 Microsoft의 purpose-built small coding model인 MAI-Code-1-Flash를 Copilot CLI, GitHub Copilot app, GitHub.com Chat, Visual Studio, GitHub Mobile, JetBrains, Eclipse, Xcode 등 더 많은 Copilot surface로 확장한다고…

AI
개발도구
읽기
2026년 6월 19일

OpenAI AI chemist — GPT-5.4가 자동화 실험실과 결합해 Chan-Lam 수율을 개선

OpenAI와 Molecule.one은 2026년 6월 17일 GPT-5.4를 Maria AI/Lab과 연결한 near-autonomous chemistry workflow가 primary sulfonamide Chan-Lam coupling에서 TEMPO 계열 additive를 찾아 수율을 개선했다고 발표했다. Maria Lab은 OAI-M1-03에서 10,080개 반응을 실행했고, 최적…

AI
OpenAI
읽기
2026년 6월 18일

Google UCP open rails — agentic commerce가 쇼핑 UI에서 표준 프로토콜 경쟁으로 이동

Google Open Source Blog는 2026년 6월 16일 Universal Commerce Protocol(UCP)의 agentic commerce 아키텍처를 Open Source Summit North America 맥락에서 정리했다. UCP는 checkout, catalog, cart, orders, identity linking 같은 commerce capability를…

AI
에이전트
읽기
2026년 6월 18일

OpenAI June 2026 Threat Report — AI 논쟁 자체가 영향공작 표적이 됐다

OpenAI의 June 2026 Threat Report는 PRC-linked influence operation이 미국 내 AI debate, 특히 data center와 AI infrastructure 논쟁을 겨냥한 사례를 다뤘다. OpenAI는 악성 사용을 탐지·차단하고 보고하는 과정에서 threat actor가 웹사이트, 소셜 계정, 여러 AI model을 함께 쓰는 다중 플랫폼…

AI
OpenAI
읽기
2026년 6월 18일

Probably $9M seed — AI 신뢰성 경쟁이 더 큰 모델에서 deterministic harness engineering으로 이동

TechCrunch는 2026년 6월 16일 Probably가 Andreessen Horowitz로부터 900만 달러 seed funding을 유치했다고 보도했다. Probably는 데이터 분석 답변을 생성한 뒤 deterministic validator가 결과를 검증하고 audit trail과 citation을 제공하는 방식으로 AI hallucination을 줄이려 한다.

AI
트렌드
읽기
2026년 6월 12일

Google Colab CLI — agent-ready compute가 로컬 터미널에서 즉시 GPU·TPU orchestration으로 이동

Google은 2026년 6월 5일 Google Colab CLI를 공개했다. 로컬 터미널에서 colab --gpu A100, colab exec, colab download, colab repl 같은 명령으로 원격 Colab 런타임을 직접 다루게 해 주며, AI agent가 바로 활용할 수 있도록 전용 skill file도 함께 제공한다.

AI
개발도구
읽기
2026년 6월 12일

OpenEnv committee launch — open agent training이 harness별 튜닝에서 공유 environment protocol로 이동

Hugging Face는 2026년 6월 8일 OpenEnv가 Meta-PyTorch, Nvidia, Modal, Prime Intellect, Unsloth 등과 함께 위원회 기반 프로젝트로 전환됐다고 발표했다. OpenEnv는 터미널, 브라우저 등 agent execution environment를 표준 인터페이스로 노출하는 레이어로 정의되며,…

AI
에이전트
읽기
2026년 6월 12일

Prometheus $12B Series B — industrial AI가 chatbot에서 physical engineering cycle compression으로 이동

Axios는 2026년 6월 11일 Jeff Bezos와 전 Google 임원 Vik Bajaj가 이끄는 Prometheus가 120억 달러 Series B를 조달해 410억 달러 valuation에 도달했다고 보도했다. 회사는 jet engine, medical device, consumer electronics 같은 물리 제품의 설계·제조 준비 주기를 10배 이상 단축할 수 있는…

AI
산업
읽기
2026년 6월 11일

AI brands as bait — AI 열풍이 모델 출시 경쟁에서 social engineering 공격면 확대로 번지다

Microsoft Threat Intelligence는 2026년 6월 8일, ChatGPT·Claude·DeepSeek·Microsoft Copilot 같은 유명 AI 브랜드를 미끼로 한 phishing·malvertising·SEO 유도 공격이 최근 수개월간 증가했다고 공개했다. 예시로 ChatGPT Plus 결제 갱신 사칭 캠페인, 2,000개 이상 조직을 겨냥한…

AI
트렌드
읽기
2026년 6월 11일

GitHub Agentic Workflows public preview — 에이전트 자동화가 YAML 작성에서 policy-aware SDLC 실행 계층으로 이동

GitHub는 2026년 6월 11일 GitHub Agentic Workflows를 public preview로 공개했다. 자연어 Markdown으로 triage, CI failure analysis, documentation update 같은 reasoning-based 작업을 정의하면 이를 GitHub Actions YAML로 컴파일하고, 기본 read-only 권한·sandboxed…

AI
에이전트
읽기
2026년 6월 11일

GitHub Copilot CLI + language servers — AI 코딩이 text grep에서 semantic code intelligence 단계로 이동

GitHub는 2026년 6월 10일 Copilot CLI가 language server를 붙여 실제 코드 인텔리전스를 활용할 수 있도록 하는 설정 방식을 공개했다. 이를 통해 에이전트는 JAR 압축 해제나 grep 위주의 우회 탐색 대신, type resolution, definition jump, reference search, hover docs 같은 LSP 기능을 직접 사용할 수…

AI
개발도구
읽기
2026년 6월 10일

AI in the Enterprise: How People Use M365 Copilot Chat — enterprise AI 채택이 검색 보조에서 문서·커뮤니케이션 작업으로 이동

Microsoft 연구진은 2026년 5월 11일 공개한 논문에서 M365 Copilot Chat 약 550만 세션을 분석해, 이 도구가 백만 개 이상 기업에서 주간 단위로 사용되고 있다고 설명했다. 분석 결과 writing이 가장 큰 비중을 차지했고, 사용 패턴은 단순 정보 검색보다 content creation과 communication 중심으로 이동하는 추세를 보였다.

AI
트렌드
읽기
2026년 6월 10일

Cloudflare acquires VoidZero — AI 코딩 시대의 배포 스택이 framework 선택에서 execution path 통합으로 이동

Cloudflare는 2026년 6월 5일 Vite 생태계를 이끄는 VoidZero를 인수한다고 밝혔다. Vite, Vitest, Rolldown, Oxc를 Workers 플랫폼과 더 깊게 결합하고, D1·R2 같은 인프라를 intent-based 방식으로 자동 프로비저닝하는 방향을 제시했다.

AI
개발도구
읽기
2026년 6월 10일

OpenRouter·Concentrate AI 부상 — LLM 경쟁이 모델 성능에서 routing economics 계층으로 이동

Business Insider는 2026년 6월 10일 OpenRouter가 최근 1억1300만 달러를 조달해 13억 달러 valuation을 받았고, Concentrate AI도 500만 달러 이상을 확보하며 스텔스에서 나왔다고 보도했다. 두 회사는 400개 이상 모델을 대상으로 비용, 가용성, 성능을 비교해 워크로드를 라우팅하는 계층을 전면에 내세우고 있다.

AI
산업
읽기
2026년 6월 9일

Claude Fable 5 — frontier model 공개가 capability race에서 guardrailed deployment 경쟁으로 이동

Anthropic은 2026년 6월 9일 Claude Fable 5를 공개하며, 그동안 제한적으로만 다뤘던 Mythos 계열 capability를 일반 사용자에게 부분 개방했다. 고위험 질의는 Opus 4.8로 자동 우회시키는 safeguard를 걸었고, 가격은 input 100만 토큰당 10달러, output 100만 토큰당 50달러로 제시했다.

AI
Claude
읽기
2026년 6월 9일

OpenAI S-1 confidential filing — AI 경쟁이 모델·제품 전쟁에서 자본시장 체력전으로 이동

OpenAI는 2026년 6월 8일 미국 SEC에 Form S-1 초안을 비공개 제출했다고 밝혔다. 공개 시점과 세부 재무는 아직 숨겨져 있지만, Anthropic에 이어 OpenAI까지 IPO 절차에 들어가면서 frontier AI 경쟁이 본격적인 public-market 준비 국면으로 넘어갔다.

AI
OpenAI
읽기
2026년 6월 9일

Salesforce Agentforce layoffs — enterprise AI가 성장 서사에서 조직 재편과 제품 현실성 검증 단계로 이동

Business Insider 보도에 따르면 Salesforce는 2026년 6월 9일 Agentforce, Mulesoft, Marketing Cloud 관련 조직을 포함한 추가 감원을 진행했다. 같은 시점에 Agentforce는 연환산 매출 10억 달러를 넘겼지만, 실제 사용성과 데모 간 격차에 대한 의문도 계속 제기되고 있다.

AI
산업
읽기
2026년 6월 8일

Dreaming: Better memory for a more helpful ChatGPT — AI personal memory가 saved note에서 지속적 user model로 전환

OpenAI는 2026년 6월 4일 ChatGPT memory를 dreaming 기반의 새 아키텍처로 업그레이드한다고 발표했다. 새 시스템은 background synthesis로 여러 대화에서 memory를 통합해 freshness·continuity·relevance를 높이며, 미국의 Plus·Pro 사용자에게 먼저 배포된다.

AI
OpenAI
읽기
2026년 6월 8일

ECB AI risk letter — 금융권 AI 도입이 pilot enthusiasm에서 board-level defensive posture로 이동

Reuters에 따르면 ECB는 2026년 6월 3일 commercial bank들에 최신 AI model이 초래할 수 있는 공격 위험에 대응하기 위한 targeted measures를 요구할 계획이라고 밝혔다. ECB는 dear CEO letter를 보내 proactive defence와 개별 은행 후속 점검에 나설 예정이다.

AI
트렌드
읽기
2026년 6월 8일

Introducing Mellum2 — software engineering용 small expert model 경쟁이 giant general model에서 low-latency control layer로 이동

JetBrains는 2026년 6월 1일 Mellum2를 공개했다. 이 모델은 text·code 특화 12B Mixture-of-Experts 구조를 사용하며 token당 2.5B만 활성화해, routing·RAG·summarization·sub-agent 같은 latency-sensitive workload에서 2배 이상 빠른 추론을 목표로 한다.

AI
오픈소스
읽기
2026년 6월 8일

US House AI draft bill — 미국 AI 규제 경쟁이 state patchwork에서 federal model-development preemption으로 이동

Reuters에 따르면 미국 하원 초당파 의원들은 2026년 6월 4일 states가 AI model development 자체를 규제하지 못하게 하는 초안 법안을 공개했다. 초안은 모델 출시 전 테스트 의무 같은 state-level rule은 막되, AI 활용 방식에 대한 state regulation은 허용하는 구조다.

AI
트렌드
읽기
2026년 6월 7일

IBM-Google Cloud Practice — enterprise agent 도입이 PoC에서 서비스 채널과 산업별 delivery asset 경쟁으로 이동

IBM과 Google Cloud는 2026년 6월 4일 새로운 Google Cloud Practice를 발표했다. IBM은 수천 명의 Google Cloud 인증 컨설턴트와 함께 IBM Consulting Advantage를 Gemini Enterprise Agent Platform, 보안, 데이터 기능과 결합하고, 금융·정부·리테일·통신·에너지 등 산업별 AI agent 포트폴리오를…

AI
산업
읽기
2026년 6월 7일

Ollama 0.30 — local AI 배포 경쟁이 모델 자체에서 runtime 호환성과 GPU 보편성으로 이동

Ollama는 2026년 6월 5일 Ollama 0.30을 공개하며 GGUF 호환성과 llama.cpp 통합을 강화했다. 발표에 따르면 NVIDIA GPU에서 최대 20% 빠른 처리량을 제공하고, Vulkan을 기본 활성화해 AMD·Intel까지 GPU 가속 범위를 넓혔으며, LFM·Prism·Unsloth 계열을 포함한 더 많은 모델을 즉시 실행할 수 있게 했다.

AI
오픈소스
읽기
2026년 6월 7일

WWDC26 Apple Intelligence APIs — on-device model access가 앱 기능에서 workflow substrate로 확장

Apple은 WWDC26 시점에 Apple Intelligence 개발 표면을 확대하며, App Intents 기반 Use Model action으로 앱이 on-device 또는 Private Cloud Compute 모델 응답을 Shortcut 흐름에 직접 연결할 수 있게 했다. 동시에 Xcode 26.3은 Anthropic과 OpenAI의 coding agents를 IDE 안에서 호출해…

AI
API
읽기
2026년 6월 6일

IBM and Red Hat Project Lightwell — open source AI 시대의 공급망 보안이 clearinghouse 모델로 재편

IBM과 Red Hat은 2026년 5월 28일 Project Lightwell을 발표하며 open source software 보안을 위해 50억 달러와 2만 명 이상의 엔지니어를 투입하겠다고 밝혔다. 이 프로젝트는 enterprise clearinghouse를 통해 취약점 신고, 검증된 패치 배포, upstream disclosure를 조율하고 AI 기반 검증·테스트를 결합하는 모델이다.

AI
오픈소스
읽기
2026년 6월 6일

Introducing Gemma 4 12B — local multimodal agent 실행이 16GB급 엣지 하드웨어로 내려오다

Google은 2026년 6월 3일 Gemma 4 12B를 공개했다. 이 모델은 vision·audio를 별도 encoder 없이 LLM backbone에 직접 투입하는 unified multimodal 구조를 채택했고, 16GB급 VRAM 또는 unified memory에서도 구동 가능하도록 설계됐으며, Apache 2.0 라이선스로 공개됐다.

AI
모델
읽기
2026년 6월 6일

Meta Business Agent — customer support agent가 CRM 플러그인에서 메시징-native 운영 계층으로 확장

Meta는 2026년 6월 초 Meta Business Agent와 Meta Business Agent Platform을 공개했다. 이 시스템은 WhatsApp, Messenger, Instagram 기반으로 고객 응대, 상품 추천, 예약, 리드 선별, 세일즈 전환을 수행하고, Shopify·Zendesk·Shopee 등 수백 개 시스템과 연결해 대규모 맞춤 배포를 지원한다.

AI
에이전트
읽기
2026년 6월 6일

Protecting against token theft — AI endpoint 보안이 인증에서 per-request 경제성 방어로 이동

Vercel은 2026년 5월 29일 AI endpoint를 노린 token theft 공격 패턴과 대응 방식을 공개했다. 회사에 따르면 4월 12일 자사 docs AI chat endpoint는 Anthropic Claude Haiku 4.5 기반 트래픽이 평시 대비 약 10배까지 급증했고, 분당 1,300 요청 수준이면 일간 1만 달러 이상 inference 비용으로 이어질 수 있었다.

AI
개발도구
읽기
2026년 6월 5일

GitHub Copilot usage-based billing — AI 코딩 도구 경쟁이 모델 품질에서 token economics와 admin control로 이동

GitHub는 2026년 6월 1일부터 Copilot을 usage-based billing으로 전환했다. 기존 premium request units 대신 GitHub AI Credits를 쓰며, 사용량은 input·output·cached tokens 기준으로 계산되고 Copilot code review는 GitHub Actions minutes도 함께 소모한다.

AI
개발도구
읽기
2026년 6월 5일

Intel Xeon 6+ — agentic AI 인프라 병목이 GPU 단일 경쟁에서 orchestration CPU·memory·network 균형으로 이동

Intel은 2026년 6월 1일 Xeon 6+와 800 Series Ethernet, 그리고 차세대 GPU Crescent Island 로드맵을 공개했다. Xeon 6+는 최대 288 Efficient-cores, 이전 세대 대비 최대 2.5배 성능, 경쟁 대비 최대 45% 높은 performance-per-thread-per-watt를 제시했고, Ethernet은 최대 200GbE까지…

AI
산업
읽기
2026년 6월 5일

Supabase Series F — vibe coding이 backend를 demo layer에서 agentic production substrate로 밀어올리다

Supabase는 2026년 6월 5일 보도 기준 5억 달러 Series F를 유치했고, valuation은 약 105억 달러 post-money 수준으로 뛰었다. TechCrunch 보도에 따르면 지난 1년 사용량은 600% 이상 성장했고, 신규 database의 60% 이상이 어떤 형태로든 AI tool에 의해 생성되고 있으며, 사용자 수는 1천만 명에 근접했다.

AI
산업
읽기
2026년 6월 4일

Palo Alto Frontier AI Defense — AI 보안이 모델 평가에서 machine-speed 대응 체계로 이동

Palo Alto Networks는 2026년 5월 7일 Frontier AI Defense를 발표하며, 최신 frontier model이 이전 세대 대비 약 50% 높은 coding efficiency를 보이고 AI-assisted 공격에서 initial access부터 exfiltration까지 시간이 25분 수준으로 줄 수 있다고 밝혔다. 이에 대응해 자사는 early model…

AI
산업
읽기
2026년 6월 4일

Redis Iris — agent stack이 prompt tuning에서 context engine 아키텍처로 이동

Redis는 2026년 5월 18일 Redis Iris를 발표하며 agent failure의 핵심 원인을 모델 성능이 아니라 context layer의 분산·지연·낙후 문제로 규정했다. Iris는 Context Retriever, Agent Memory, Data Integration, LangCache, Redis Search 다섯 요소를 묶어…

AI
에이전트
읽기
2026년 6월 4일

SAP sustainability AI agents — enterprise AI가 챗봇에서 규제 워크플로 자동화로 이동

SAP는 2026년 5월 15일 SAP Sapphire에서 sustainability AI agents를 발표했고, 2026년 말까지 일반 제공을 목표로 한다고 밝혔다. SAP에 따르면 이 agents는 packaging compliance review 시간을 50% 이상 줄이고, scenario simulation 시간을 하루에서 20분으로 단축하며, GHS classification…

AI
산업
읽기
2026년 6월 4일

Snowflake acquires Natoma — MCP가 실험적 연결 규약에서 enterprise governance layer로 이동

Snowflake는 2026년 5월 27일 enterprise MCP 플랫폼 Natoma 인수 계약을 발표했다. 발표에 따르면 Snowflake는 verified MCP server library와 MCP Gateway를 통해 Cortex Agents, Snowflake Intelligence, Cortex Code가 SaaS·VPC·on-prem 시스템에 연결될 때…

AI
에이전트
읽기
2026년 6월 3일

Coralogix 200M Series F: AI agent observability가 독립 인프라 카테고리로 부상

Coralogix는 2026년 6월 3일 보도 기준 Series F로 2억 달러를 조달했고, post-money valuation은 16억 달러로 제시됐다. 이번 투자는 AI agent 확산으로 인해 autonomous software를 모니터링·트러블슈팅·관리하는 observability layer 수요가 커질 것이라는 베팅 위에서 이뤄졌다.

AI
산업
읽기
2026년 6월 3일

Postman AI Engineer: API 조직이 context debt를 관리하는 agentic engineering 계층

Postman은 2026년 6월 2일 AI Engineer를 발표했다. 이 제품은 Context Graph를 기반으로 API, 서비스, 의존성 지형을 지속적으로 맵핑하고, secure sandbox에서 repo pull, bash 실행, UI test, PR QA까지 수행하며 undocumented API 탐색, system design review, root cause analysis,…

AI
개발도구
읽기
2026년 6월 3일

Workday DevCon 2026: enterprise agent가 HR·Finance system of record로 진입하는 검증 스택 공개

Workday는 2026년 6월 2일 DevCon에서 Developer Agent, Agent-Ready Tools, Agent Passport를 공개했다. Claude Code, Codex, Cursor 같은 agentic IDE에서 자연어로 Workday agent를 만들고, MCP 기반 도구로 HR·Finance 데이터에 접근시키며, OWASP LLM Top 10·NIST AI…

AI
에이전트
읽기
2026년 6월 2일

Build 2026: Microsoft가 Windows를 local agent runtime으로 전환

Microsoft는 2026년 6월 2일 Build 2026에서 Windows 개발 플랫폼 업데이트를 발표하며 Aion 1.0 Instruct와 Aion 1.0 Plan을 공개했다. 특히 Aion 1.0 Plan은 14B 규모, 32K context의 reasoning·tool-calling 모델로, capable device에서 Windows에 in-box로 탑재돼 로컬에서 파일 관리와…

AI
개발도구
읽기
2026년 6월 2일

Cisco Cloud Control: IT 운영이 dashboard에서 agentic control plane으로 이동

Cisco는 2026년 6월 2일 Cisco Live US에서 Cisco Cloud Control을 발표했다. 이 플랫폼은 네트워킹·보안·컴퓨트·옵저버빌리티 데이터를 하나의 관리 plane으로 묶고, 운영자가 자연어로 앱과 에이전트를 만들며 50개 이상 외부 도구 및 MCP와 연결할 수 있게 설계됐다.

AI
에이전트
읽기
2026년 6월 2일

Codex for every role, tool, and workflow — 코딩 에이전트가 팀 업무 플랫폼으로 확장

OpenAI는 2026년 6월 2일 Codex용 role-specific plugins, annotations, Sites preview를 발표했다. 회사는 Codex 주간 사용자가 500만 명을 넘었고, 비개발자 사용자가 전체의 약 20%이며 개발자보다 3배 이상 빠르게 늘고 있다고 밝혔다.

AI
OpenAI
읽기
2026년 6월 2일

미국 AI 행정명령: frontier model 정책이 보안 운영 체계로 구체화

백악관은 2026년 6월 2일 'Promoting Advanced Artificial Intelligence Innovation and Security' 행정명령을 발표했다. 명령은 30일 안에 연방 시스템의 AI 기반 방어 우선순위를 높이고, AI 업계와 중요 인프라 운영자가 함께 참여하는 cybersecurity clearinghouse를 구성하며, 60일 안에 covered…

AI
트렌드
읽기
2026년 6월 1일

Introducing Command A+ — sovereign enterprise AI가 폐쇄형 API 의존에서 배포 가능한 open model stack으로 이동

Cohere는 2026년 5월 20일 Command A+를 Apache 2.0으로 공개했다. 이 모델은 218B total·25B active의 MoE 구조, 128K 입력 컨텍스트, 텍스트·이미지·tool use를 지원하며 최소 2×H100 환경에서도 구동 가능한 enterprise용 open model이다.

AI
모델
읽기
2026년 6월 1일

NVIDIA Alpamayo 2 Super — autonomous driving이 perception stack에서 reasoning-first physical AI stack으로 이동

NVIDIA는 2026년 6월 1일 Alpamayo 2 Super를 공개했다. 이 모델은 32B 규모의 open reasoning vision-language-action model로, level 4 robotaxi 개발을 위해 perception·planning·action을 하나의 driving stack으로 묶고, 함께 AlpaGym·OmniDreams·NuRec 기반 agent…

AI
모델
읽기
2026년 6월 1일

Salesforce acquires Contentful — enterprise AI가 CRM assistant에서 content orchestration layer 통합으로 이동

Salesforce는 2026년 6월 1일 Contentful 인수 계약 체결을 발표했다. 회사는 Data 360, Agentforce, Contentful의 composable API를 결합해 Customer 360 전반에 native content layer를 넣고, 채널별로 다른 정적 콘텐츠를 AI가 조합하는 구조로 전환하겠다고 밝혔다.

AI
산업
읽기
2026년 5월 31일

AWS launches Amazon Quick desktop AI assistant that works across your applications, tools, and data

Amazon은 2026년 5월 27일 Amazon Quick의 데스크톱 앱을 공개했다. Quick은 로컬 파일, 캘린더, 이메일, 브라우저 기반 업무 도구를 백그라운드에서 연결하고, 개인 knowledge graph와 장기 메모리를 바탕으로 문서·대시보드·프레젠테이션 생성과 cross-app workflow 자동화를 수행한다.

AI
트렌드
읽기
2026년 5월 31일

Enhanced AI Management and Analytics for Organizations

JetBrains는 2026년 2월 12일 JetBrains Console을 공개하며 조직 단위 AI 관리·관측 기능을 발표했다. 관리자는 팀별 AI 활성화, Claude Agent·OpenAI Codex·Junie 접근 제어, AI Credit 풀·개별 한도, 데이터 수집 옵션, 활성 사용자와 코드 수용률 같은 사용 지표를 중앙에서 관리할 수 있다.

AI
개발도구
읽기
2026년 5월 31일

Introducing Trusted Remote Execution: Policy-Enforced Scripts for AI Agents and Humans

AWS는 2026년 5월 4일 Trusted Remote Execution(Rex)을 오픈소스로 공개했다. Rex는 Rhai 스크립트가 host에 직접 접근하지 못하게 하고, 모든 시스템 작업을 Cedar policy로 승인한 뒤에만 실행하는 runtime으로, AI agent가 만든 스크립트도 동일한 정책 경계 안에서 동작한다.

AI
오픈소스
읽기
2026년 5월 31일

TeamCity 2026.1: CLI, MCP for AI Agents, Pipelines Enhancements, and More

JetBrains는 2026년 5월 12일 TeamCity 2026.1을 발표하며 TeamCity CLI와 MCP support를 공개했다. 새 CLI는 60개 이상의 명령으로 빌드 조사·재실행·파이프라인 설정을 터미널과 AI agent에서 수행하게 하고, MCP endpoint는 외부 AI tooling이 빌드 로그와 실행 데이터를 읽고 원격 run을 시작할 수 있게 한다.

AI
개발도구
읽기
2026년 5월 30일

AI coding startup Cognition raises $1B at $25B pre-money valuation — 코딩 에이전트 경쟁이 데모 품질에서 revenue proof와 orchestration economics로 이동

Cognition은 2026년 5월 27일 10억 달러 이상을 조달하며 pre-money 기준 250억 달러, post-money 기준 260억 달러 가치평가를 받았다. TechCrunch 보도에 따르면 Devin의 enterprise 사용 확대와 함께 annualized revenue run-rate는 4억9200만 달러에 도달했고, 최근 6개월간 월별 성장률은 50% 수준이라고 밝혔다.

AI
개발도구
읽기
2026년 5월 30일

AI Now Summit 2026 — 산업용 AI 경쟁이 범용 assistant에서 domain-specific engineering stack으로 이동

Mistral은 2026년 5월 28일 AI Now Summit에서 Airbus, BMW Group, ASML 사례를 공개하며 industrial engineering용 AI stack을 전면에 내세웠다. Airbus에는 설계부터 onboard capability까지 AI를 넣고, BMW의 LIM initiative에는 engineering data 기반 multimodal…

AI
산업
읽기
2026년 5월 30일

Introducing Search Toolkit — agent retrieval 경쟁이 RAG 데모에서 검색 파이프라인 운영력으로 이동

Mistral은 2026년 5월 28일 Search Toolkit을 public preview로 공개했다. 이 오픈소스 프레임워크는 ingestion, retrieval, evaluation을 하나의 공통 인터페이스로 묶고, BM25·dense retrieval·hybrid search와 recall, precision, MRR, NDCG 평가를 함께 제공한다.

AI
개발도구
읽기
2026년 5월 30일

NVIDIA and IREN Announce Strategic Partnership to Accelerate Deployment of up to 5 Gigawatts of AI Infrastructure — AI infra 경쟁이 GPU 조달에서 전력·부지 결합형 factory rollout으로 이동

NVIDIA와 IREN은 2026년 5월 7일 최대 5GW 규모의 NVIDIA DSX-aligned AI infrastructure 배치를 목표로 하는 전략적 파트너십을 발표했다. Sweetwater, Texas의 2GW 캠퍼스를 핵심 거점으로 삼고, NVIDIA는 최대 3천만 주를 주당 70달러에 매입할 수 있는 5년 권리를 받아 조건부로 최대 21억 달러를 투자할 수 있게 됐다.

AI
산업
읽기
2026년 5월 29일

Arm open-sources Metis — AI 보안 검증이 규칙 기반 스캐너에서 repo-context reasoning으로 이동

Arm은 2026년 5월 28일 Metis를 오픈소스로 공개했다. Metis는 source code·build files·documentation을 함께 읽는 RAG 기반 agentic AI security framework로, Arm 내부 130개 이상 소프트웨어 프로젝트에서 사용 중이며 true positive는 최대 10배 높이고 false positive는 약 50% 줄였다고 밝혔다.

AI
오픈소스
읽기
2026년 5월 29일

Intel introduces SuperClaw — agent 인프라 경쟁이 cloud-only에서 hybrid on-device routing으로 이동

Intel은 2026년 5월 21일 SuperClaw를 공개했다. Intel Core Ultra Series 3와 Arc Pro B-series 기반에서 sensitive tasks는 local, advanced reasoning은 cloud로 라우팅하는 hybrid agentic AI solution이며, cloud-only 대비 평균 cloud compute token…

AI
에이전트
읽기
2026년 5월 29일

Linux Foundation launches DNS-AID — agent discovery 경쟁이 중앙 레지스트리에서 DNS 기반 개방 표준으로 이동

Linux Foundation은 2026년 5월 27일 DNS-AID 프로젝트를 공개했다. 이 프로젝트는 DNS 인프라를 활용해 AI agents와 MCP servers를 publish, discover, verify할 수 있게 하는 오픈소스 reference implementation으로, Python SDK·CLI·MCP server를 함께 제공한다.

AI
에이전트
읽기
2026년 5월 29일

OpenAI launches Rosalind Biodefense — frontier model 배치가 범용 챗봇에서 방어형 life-science workflow로 확장

OpenAI는 2026년 5월 29일 Rosalind Biodefense를 발표했다. GPT-Rosalind를 활용해 trusted developers가 epidemiological modeling, early detection, screening, preparedness, diagnostics, medical countermeasure development 같은 biodefense…

AI
OpenAI
읽기
2026년 5월 28일

CoreWeave Closes the Training-to-Inference Gap for Autonomous Agent Improvement — 에이전트 운영 경쟁이 모델 선택에서 closed-loop 학습 인프라로 이동

CoreWeave는 2026년 5월 28일 RL, production inference, agent observability, autonomous improvement를 하나로 묶는 unified agentic AI capabilities를 발표했다. Serverless RL, CoreWeave Inference, W&B Weave, W&B Skills/MCP server를 연결해…

AI
산업
읽기
2026년 5월 28일

Introducing Claude Opus 4.8 — 모델 경쟁이 지능 향상에서 장시간 agent workflow 신뢰성 경쟁으로 이동

Anthropic은 2026년 5월 28일 Claude Opus 4.8을 공개했다. Opus 4.7 대비 coding·agentic tasks·reasoning 성능을 개선했고, 가격은 유지한 채 Claude Code용 dynamic workflows 연구 프리뷰와 effort control도 함께 내놨다.

AI
Claude
읽기
2026년 5월 28일

Warp is now open-source — agentic development 도구 경쟁이 폐쇄형 제품에서 공개형 orchestrated workflow로 이동

Warp는 2026년 4월 28일 Warp client를 AGPL로 오픈소스화하고, 커뮤니티가 Oz 기반 agent-first workflow로 제품 개발에 참여할 수 있다고 발표했다. 동시에 Kimi·MiniMax·Qwen 같은 오픈 모델 지원, auto (open) model routing, 설정 파일 공개도 함께 내놨다.

AI
개발도구
읽기
2026년 5월 27일

Building the agentic future: Developer highlights from I/O 2026 — Google이 agent 개발 스택을 managed runtime으로 끌어올렸다

Google은 2026년 5월 19일 I/O에서 Gemini 3.5 Flash, Antigravity 2.0, Gemini API용 Managed Agents, 그리고 Google AI Studio의 Android/Workspace 연동을 한 묶음으로 공개했다. 특히 Managed Agents는 단일 API 호출로 격리된 Linux 환경에서 reasoning·tool use·code…

AI
Gemini
읽기
2026년 5월 27일

EY and Microsoft launch a $1B enterprise AI initiative — enterprise AI 경쟁이 PoC에서 field engineering 운영으로 이동

EY와 Microsoft는 2026년 5월 22일 향후 5년간 10억 달러 이상을 공동 투자하는 글로벌 enterprise AI initiative를 발표했다. Microsoft의 Forward Deployed Engineers와 EY 산업 전문가가 통합 팀을 구성해 고객사의 핵심 업무에 AI를 대규모 배치하고, EY 내부에서는 Copilot을 15만 명에게 먼저 배포해 15% 생산성…

AI
산업
읽기
2026년 5월 27일

Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs — agent 인프라 경쟁이 GPU 단독에서 CPU 설계로 확장

NVIDIA는 2026년 5월 18일 자사 첫 custom CPU인 Vera를 Anthropic, OpenAI, SpaceXAI, Oracle Cloud Infrastructure에 인도했다고 발표했다. Vera는 88개의 Olympus 코어, 1.2TB/s 메모리 대역폭, 기존 설계 대비 50% 빠른 per-core 성능을 내세우며, agent orchestration·tool…

AI
산업
읽기
2026년 5월 26일

Anthropic acquires Stainless — 에이전트 경쟁의 병목이 모델 지능에서 connector supply chain 통제로 이동

Anthropic은 2026년 5월 18일 SDK·CLI·MCP server 생성 툴링 회사 Stainless를 인수한다고 발표했다. Anthropic은 Stainless가 자사 공식 SDK를 초기부터 생성해 왔으며, 수백 개 기업이 Stainless를 사용해 TypeScript·Python·Go·Java 등 다수 언어용 SDK와 MCP server를 만들고 있다고 설명했다.

AI
Claude
읽기
2026년 5월 26일

EU agrees AI Act simplification package — AI 규제 경쟁의 초점이 금지 강화보다 시행 부담 재설계로 이동

EU Council과 European Parliament negotiators는 2026년 5월 7일 AI 규칙 단순화에 대한 잠정 합의에 도달했고, 관련 공지는 5월 18일 보강 업데이트됐다. 합의안은 high-risk AI 규정 적용 시점을 standalone 시스템은 2027년 12월 2일, 제품 내장형 시스템은 2028년 8월 2일로 늦추는 한편, 투명성 솔루션 적용 유예는…

AI
산업
읽기
2026년 5월 26일

GPT-5.3-Codex becomes Copilot’s base model — 엔터프라이즈 AI 코딩 도입의 핵심이 모델 성능보다 변경 통제와 LTS 거버넌스로 이동

GitHub는 2026년 5월 17일 GPT-5.3-Codex를 Copilot Business·Enterprise의 기본 모델로 전환했다. 이 모델은 2026년 2월 5일 출시됐고 2027년 2월 4일까지 12개월 LTS가 보장되며, 기본 승인 모델로 쓰일 때 GPT-4.1을 대체하고 1x premium request multiplier가 적용된다.

AI
개발도구
읽기
2026년 5월 25일

Building for the Intelligence System on Android — Android가 앱을 호출하는 방식이 UI 중심에서 agent-callable capability로 이동

Google은 2026년 5월 12일 Android를 단순 OS가 아니라 “intelligence system”으로 재정의하고, Gemini Intelligence와 AppFunctions를 통해 앱의 기능을 OS와 에이전트가 직접 호출할 수 있는 경로를 공개했다. 초기 private preview에서는 KakaoTalk 같은 앱이 메시지 전송과 음성 통화 같은 기능을 자연어 기반…

AI
Gemini
읽기
2026년 5월 25일

Google-Blackstone AI cloud venture — AI 인프라 경쟁이 모델 판매에서 전력·TPU 수용력 패키징으로 이동

Reuters는 2026년 5월 18일 Google과 Blackstone이 AI cloud venture를 출범시킨다고 보도했다. Blackstone은 초기 equity 50억 달러를 투입해 2027년까지 500MW 데이터센터 용량을 올리고, 이 벤처는 Google TPU와 데이터센터 수용력을 묶어 compute-as-a-service 형태로 제공할 예정이다. 총 투자 규모는 차입을 포함해…

AI
산업
읽기
2026년 5월 25일

Project Glasswing: An initial update — AI 보안 경쟁의 병목이 취약점 탐지에서 triage·patch 운영으로 이동

Anthropic은 2026년 5월 22일 Project Glasswing의 첫 업데이트를 공개하며, Mythos Preview와 약 50개 파트너가 한 달 만에 1만 건이 넘는 high/critical 취약점을 찾았다고 밝혔다. 오픈소스 프로젝트 1,000개 이상을 스캔해 총 23,019건의 취약점을 탐지했고, 그중 고위험으로 추정한 1,752건을 외부 보안 연구진이 검증한 결과…

AI
Claude
읽기
2026년 5월 25일

PyTorch 2.12 Release — 모델 프레임워크 경쟁이 연구 편의성에서 하드웨어 중립 배포와 추론 효율로 이동

PyTorch Foundation은 2026년 5월 13일 PyTorch 2.12를 공개했다. 이번 릴리스는 CUDA에서 batched linalg.eigh 최대 100배 가속, torch.accelerator.Graph를 통한 CUDA/XPU 공통 graph capture API, torch.export의 Microscaling quantization 포맷 지원, torch.cond의…

AI
개발도구
읽기
2026년 5월 24일

California signs AI disruption executive order — AI 경쟁이 모델 정책을 넘어 노동시장 운영체계로 번진다

California 주정부는 2026년 5월 21일 AI로 인한 노동시장 충격에 대비하는 행정명령을 발표했다. 이 명령은 180일 내 WARN Act 개정 권고, AI 영향 대시보드, 조기 경보 지표, 직무 전환 지원, 소기업 교육·인센티브, worker ownership 모델 검토 등을 포함한다.

AI
트렌드
읽기
2026년 5월 24일

Circle Agent Stack — 에이전트 경제의 병목이 추론이 아니라 결제·지갑·서비스 발견 계층으로 이동한다

Circle은 2026년 5월 11일 Circle Agent Stack을 발표하며 Circle CLI, Agent Wallets, Agent Marketplace, 그리고 Circle Gateway 기반 nanopayments를 공개했다. 목표는 AI agent가 USDC로 자산을 보유하고, 서비스 탐색과 결제를 machine-speed로 수행하는 경제 인프라를 제공하는 것이다.

AI
에이전트
읽기
2026년 5월 24일

Docusign Unveils AI Assistant and Agents — 계약 시스템이 문서 저장소에서 실행형 workflow surface로 바뀐다

Docusign은 2026년 5월 21일 Intelligent Agreement Management(IAM) 위에 AI assistant, agents, Agent Studio, AI-assisted Web Forms, 그리고 Docusign MCP beta를 발표했다. early access는 미국에서 즉시 시작됐고, AI assistant·agents·Agent Studio는 7월부터…

AI
에이전트
읽기
2026년 5월 24일

Red Hat Launches New Developer Tools for Agentic AI — 로컬 샌드박스와 공급망 검증이 agent 개발 기본 스택으로 들어온다

Red Hat은 2026년 5월 12일 Red Hat Desktop GA, isolated AI agent sandboxing, 그리고 Red Hat Advanced Developer Suite 확장을 발표했다. 핵심은 로컬 Podman 기반 개발 환경, OpenShift Dev Spaces, trusted software factory, SLSA Level 3 기반 Trusted…

AI
개발도구
읽기
2026년 5월 23일

Chrome DevTools for agents 1.0 — 코딩 에이전트가 정적 코드 생성에서 브라우저 런타임 검증으로 이동

Chrome 팀은 2026년 5월 19일 Chrome DevTools for agents 1.0을 stable로 공개했다. 이번 릴리스는 MCP server, token-efficient CLI, agent skills를 통해 코딩 에이전트가 실제 브라우저에서 앱을 열고 Lighthouse audit, device/network emulation, 성능·접근성 검증까지 직접 수행할 수 있게…

AI
개발도구
읽기
2026년 5월 23일

Computer-using agents in Microsoft Copilot Studio GA — enterprise automation이 API 우선에서 UI 실행 계층까지 확장

Microsoft는 2026년 5월 13일 Copilot Studio의 computer-using agents를 general availability로 전환했다. 이 기능은 API가 없는 legacy system, vendor portal, 내부 웹앱처럼 UI 중심으로만 접근 가능한 환경에서도 agent가 직접 화면을 조작해 업무를 수행하도록 설계됐다.

AI
에이전트
읽기
2026년 5월 23일

Honeycomb Agent Observability — 에이전트 운영 경쟁이 프롬프트 품질에서 trace 재구성과 조사 자동화로 이동

Honeycomb는 2026년 5월 12일 Agent Timeline, Canvas Agent, Canvas Skills를 포함한 Agent Observability 기능군을 공개했다. 이 기능은 LLM call, tool invocation, agent handoff, downstream system impact를 하나의 production observability layer에서…

AI
에이전트
읽기
2026년 5월 21일

Introducing AMS — 오픈웨이트 LLM 검증이 프롬프트 테스트에서 구조적 안전성 스캔으로 이동

Google은 2026년 4월 27일 AMS(Activation-based Model Scanner)를 오픈소스로 공개했다. 이 도구는 프롬프트를 실제로 생성하지 않고도 10~40초 안에 open-weight LLM의 safety-relevant activation structure를 검사해, instruction-tuned 모델과 uncensored 또는 변조된 모델을 구분하도록 설계됐다.

AI
오픈소스
읽기
2026년 5월 21일

Introducing STATE-Bench — 에이전트 메모리 경쟁이 retrieval 정확도에서 작업 신뢰성 검증으로 이동

Microsoft는 2026년 5월 19일 STATE-Bench를 공개했다. 이는 AI agent memory를 단순 retrieval 문제가 아니라 실제 task completion, pass^5 reliability, token efficiency 관점에서 측정하는 오픈 benchmark다.

AI
에이전트
읽기
2026년 5월 21일

WebMCP — 브라우저 에이전트 통합이 DOM 추론에서 구조화된 tool surface로 이동

Chrome 팀은 2026년 5월 18일 WebMCP를 공개했다. 이는 웹페이지가 JavaScript와 HTML annotation을 통해 agent용 structured tools를 노출하게 하는 제안 표준으로, agent가 버튼과 폼의 의미를 DOM에서 추론하는 대신 checkout, filter_results, submit_application 같은 명시적 tool을 호출하게 한다.

AI
에이전트
읽기
2026년 5월 20일

Advancing content provenance for a safer, more transparent AI ecosystem — AI 생성물 경쟁이 품질에서 검증 가능성으로 확장

OpenAI는 2026년 5월 19일 C2PA conformant generator product 전환, Google SynthID 기반 이미지 watermark 도입, 그리고 공개 검증 도구 preview를 포함한 content provenance 강화 계획을 발표했다. SynthID는 ChatGPT, Codex, OpenAI API를 통해 생성된 이미지에 적용되며, 검증 도구는…

AI
OpenAI
읽기
2026년 5월 20일

Amazon Bedrock AgentCore Payments — AI agent 수익화 인프라가 결제 API가 아니라 runtime primitive가 되기 시작

AWS는 2026년 5월 7일 Amazon Bedrock AgentCore Payments preview를 발표했다. Coinbase와 Stripe와 함께 만든 이 기능은 AI agent가 API, MCP server, 웹 콘텐츠, 다른 agent에 대해 autonomous payment를 수행할 수 있게 하며, x402 negotiation, wallet authentication,…

AI
에이전트
읽기
2026년 5월 20일

Introducing RAMPART and Clarity — agent 안전이 보안 리뷰에서 CI와 설계 산출물로 이동

Microsoft는 2026년 5월 20일 RAMPART와 Clarity를 오픈소스로 공개했다. RAMPART는 adversarial 및 benign 시나리오를 pytest 기반 반복 테스트로 작성해 CI에 넣는 agent safety 테스트 프레임워크이고, Clarity는 문제 정의·실패 분석·의사결정을 .clarity-protocol/ Markdown 산출물로 남기는 structured…

AI
개발도구
읽기
2026년 5월 20일

NVIDIA-Verified Agent Skills Provide Capability Governance for AI Agents — agent 확장성 경쟁이 capability supply chain 검증으로 이동

NVIDIA는 2026년 5월 19일 agent skill에 transparency, security scanning, cryptographic signing, machine-readable skill card를 부여하는 NVIDIA-Verified Skills 체계를 공개했다. 검증된 skill은 cataloging, review, SkillSpector 스캔, signing,…

AI
에이전트
읽기
2026년 5월 20일

OpenAI and Dell Technologies partner to bring Codex to hybrid and on-premises enterprise environments — 코딩 에이전트 경쟁이 SaaS를 넘어 enterprise data plane으로 이동

OpenAI는 2026년 5월 18일 Dell Technologies와 협력해 Codex를 hybrid 및 on-premises enterprise 환경으로 확장한다고 발표했다. Codex는 Dell AI Data Platform과 연동되고, Dell AI Factory와의 연결도 검토되며, OpenAI는 현재 Codex 주간 사용자가 400만 명을 넘는다고 밝혔다.

AI
OpenAI
읽기
2026년 5월 19일

AWS MCP Server GA — agent access 제어가 프롬프트 품질보다 클라우드 운영성의 핵심이 된다

AWS는 2026년 5월 6일 AWS MCP Server의 general availability를 발표했다. 이 서버는 IAM·SigV4 기반 인증, AWS-MCP CloudWatch metrics, CloudTrail 로깅, sandboxed script execution, 그리고 Agent SOPs에서 Skills로의 전환을 포함해 AI coding agent가 AWS에 안전하게…

AI
개발도구
읽기
2026년 5월 19일

Claude Managed Agents updates — self-hosted sandbox와 MCP tunnel이 enterprise agent 경계를 재정의

Anthropic은 2026년 5월 19일 Claude Managed Agents에 self-hosted sandboxes와 MCP tunnels를 추가했다고 발표했다. self-hosted sandbox는 public beta, MCP tunnels는 research preview로 제공되며, agent loop는 Anthropic 인프라에 남기되 실제 tool execution과…

AI
Claude
읽기
2026년 5월 19일

Gemini 3.5 Flash — Google이 agentic coding의 기본 축을 모델+하네스 결합으로 재정의

Google은 2026년 5월 19일 Gemini 3.5 Flash를 공개하며 Gemini app, AI Mode in Search, Google Antigravity, Gemini API, Android Studio, Gemini Enterprise Agent Platform 전반에 즉시 배포했다. Google은 이 모델이 Terminal-Bench 2.1 76.2%, GDPval-AA…

AI
Gemini
읽기
2026년 5월 18일

Anthropic acquires Stainless — 에이전트 경쟁의 병목이 모델 성능에서 SDK·MCP 연결성으로 이동

Anthropic은 2026년 5월 18일 SDK 및 MCP server tooling 회사 Stainless를 인수한다고 발표했다. Stainless는 2022년 설립 이후 Anthropic의 공식 SDK 전부를 생성해 왔고, API spec으로부터 TypeScript, Python, Go, Java, Kotlin 등의 SDK, CLI, MCP server를 만드는 툴링을 제공해 왔다.

AI
Claude
읽기
2026년 5월 18일

GPT-5.3-Codex is now the base model for Copilot Business and Enterprise — 코딩 모델 선택이 기능이 아니라 거버넌스 기본값이 된다

GitHub는 2026년 5월 17일 GPT-5.3-Codex를 Copilot Business와 Copilot Enterprise의 기본 base model로 전환했다고 발표했다. 이 모델은 조직이 다른 모델을 내부 검토로 승인하지 않았을 때 기본값으로 사용되며, GitHub의 첫 LTS model로서 2027년 2월 4일까지 12개월 가용성이 보장된다.

AI
OpenAI
읽기
2026년 5월 18일

Hermes Unlocks Self-Improving AI Agents, Powered by NVIDIA RTX PCs and DGX Spark — 로컬 에이전트 경쟁이 모델보다 orchestration 설계로 이동

NVIDIA는 2026년 5월 13일 Nous Research의 오픈소스 Hermes Agent를 소개하며, 이 프레임워크가 3개월도 안 돼 GitHub star 14만 개를 넘겼고 OpenRouter 기준 가장 많이 쓰이는 agent라고 설명했다. Hermes는 self-evolving skills, contained sub-agents, curated reliability를 내세우며…

AI
오픈소스
읽기
2026년 5월 18일

Introducing IBM Bob — 엔터프라이즈 AI 코딩이 단일 assistant에서 SDLC orchestration 플랫폼으로 확장

IBM은 2026년 4월 28일 enterprise용 AI development partner IBM Bob의 GA를 발표했다. IBM은 8만 명 이상의 사내 사용과 평균 45% 생산성 향상, multi-model orchestration, persona-based modes, human-in-the-loop governance, modernization 자동화를 핵심 가치로 제시했다.

AI
개발도구
읽기
2026년 5월 17일

Anthropic x PwC expanded partnership — AI 도입 경쟁이 파일럿을 넘어 대규모 운영체계·인력 재훈련 단계로 진입

Anthropic은 2026년 5월 14일 PwC와의 전략적 제휴 확대를 발표했다. PwC는 미국 팀부터 Claude Code와 Cowork를 도입해 수십만 명 규모의 글로벌 조직으로 확장할 계획이며, 양사는 공동 Center of Excellence와 30,000명 대상 Claude 교육·인증 프로그램도 추진한다.

AI
Claude
읽기
2026년 5월 17일

Local open models on laptops — 오픈모델 성능 향상이 하드웨어보다 아키텍처 혁신에 더 크게 의존하기 시작

Hugging Face 커뮤니티 글은 2026년 5월 11일, 128GB MacBook Pro 기준 로컬에서 구동 가능한 최상위 오픈웨이트 모델의 성능이 2년 사이 Artificial Analysis Intelligence Index 10 → 47로 상승했다고 정리했다. 같은 기간 RAM 상한은 128GB로 거의 고정됐고, 향상의 핵심 동인은 sparse MoE, mixed…

AI
오픈소스
읽기
2026년 5월 17일

OpenAI realtime voice models — 음성 인터페이스가 STT/TTS를 넘어 실시간 reasoning·translation 런타임으로 진화

OpenAI는 2026년 5월 7일 API용 음성 모델 3종을 발표했다. GPT-Realtime-2는 GPT-5급 추론을 실시간 음성 상호작용에 넣었고, GPT-Realtime-Translate는 70개 이상 입력 언어를 13개 출력 언어로 동시 통역하며, GPT-Realtime-Whisper는 저지연 전사를 제공한다.

AI
OpenAI
읽기
2026년 5월 16일

AI sovereignty on AWS — sovereign AI의 핵심이 모델 선택보다 통제 가능한 배치 옵션으로 이동

AWS는 2026년 5월 12일 AI sovereignty를 위한 인프라·정책 프레임을 공개하며, AI Factories, Outposts, Local Zones, European Sovereign Cloud, Bedrock의 private fine-tuning 옵션 등을 묶어 제시했다. AWS는 Bedrock 입력·출력이 Amazon Nova나 third-party model 학습에…

AI
산업
읽기
2026년 5월 16일

Anthropic x Gates Foundation — AI 배치 경쟁이 상업 영역을 넘어 공공성과 글로벌 헬스로 확장

Anthropic은 2026년 5월 14일 Gates Foundation과 4년에 걸쳐 2억 달러 규모의 grant funding, Claude usage credits, 기술 지원을 제공하는 파트너십을 발표했다. 대상 분야는 global health, life sciences, education, economic mobility이며, healthcare…

AI
Claude
읽기
2026년 5월 16일

Cerebras IPO — AI 인프라 경쟁이 비상장 실험에서 공개시장 검증 단계로 진입

Cerebras는 2026년 5월 13일 IPO 가격을 주당 185달러로 확정하고 3,000만 주를 공모한다고 발표했다. 총 조달 규모는 약 55.5억 달러이며, 상장은 5월 14일 Nasdaq에서 CBRS 티커로 시작됐다.

AI
산업
읽기
2026년 5월 15일

Claude Platform on AWS GA — 모델 선택 경쟁이 계정·과금·감사 경계까지 포함한 유통 경쟁으로 이동

AWS는 2026년 5월 11일 Claude Platform on AWS의 general availability를 발표했다. 고객은 별도 Anthropic 계정 없이 기존 AWS 계정, IAM, CloudTrail, 통합 과금 체계 안에서 Claude APIs, Console, Managed Agents(beta), MCP connector(beta), Skills(beta), code…

AI
Claude
읽기
2026년 5월 15일

Gemini in Chrome on Android — 모바일 브라우저가 읽기 도구에서 실행형 agent surface로 전환

Google은 2026년 5월 12일 Gemini in Chrome과 auto browse를 Android에 도입한다고 발표했다. Gemini 3.1 기반으로 현재 페이지를 이해해 요약·질문 응답·Google 앱 연동을 수행하고, auto browse는 SpotHero 주차 예약이나 Chewy 주문 변경 같은 웹 기반 작업을 반자동으로 실행하며 민감한 작업 전에는 사용자 확인을 요구한다.

AI
Gemini
읽기
2026년 5월 15일

GitHub Copilot CLI agent in JetBrains — IDE 코파일럿이 worktree-isolated 장기 실행 에이전트로 수렴

GitHub는 2026년 5월 13일 JetBrains용 Copilot 업데이트에서 Copilot CLI agent 퍼블릭 프리뷰, unified sessions view, Ask question tool, global .agent.md 지원을 발표했다. 특히 CLI agent를 IDE 안으로 끌어와 worktree isolation과 workspace isolation을 선택할 수 있게…

AI
개발도구
읽기
2026년 5월 15일

Work with Codex from anywhere — 코딩 에이전트 경쟁이 데스크톱 보조에서 cross-device orchestration으로 확장

OpenAI는 2026년 5월 14일 Codex를 ChatGPT 모바일 앱에 프리뷰 형태로 넣고, Remote SSH 일반 제공, Hooks GA, programmatic access tokens, HIPAA-compliant local use까지 함께 발표했다. 이제 Codex는 단순 데스크톱 코딩 보조가 아니라 휴대폰에서 승인·방향 전환·원격 진행 관리까지 가능한 장기 실행형 에이전트…

AI
OpenAI
읽기
2026년 5월 14일

Conductor — multi-agent orchestration이 LLM 라우팅에서 deterministic YAML workflow로 이동

Microsoft는 2026년 5월 14일 오픈소스 CLI Conductor를 공개했다. MIT 라이선스 기반으로 multi-agent workflow를 YAML로 선언하고, 에이전트 간 라우팅을 LLM이 아니라 deterministic graph로 실행하며, 조건 분기는 Jinja2 템플릿과 expression evaluation으로 처리해 orchestration layer 자체의 토큰…

AI
에이전트
읽기
2026년 5월 14일

Red Hat Developer Tools for Agentic AI — 로컬 실험이 enterprise-grade sandbox와 supply-chain path로 수렴

Red Hat은 2026년 5월 12일 agentic AI용 개발자 도구 세트를 발표했다. Red Hat Desktop GA와 함께 Podman Desktop 상용 지원, local AI agent sandboxing, OpenShift Dev Spaces의 AWS Kiro·Copilot·Claude CLI 통합, 그리고 SLSA Level 3 기반 Red Hat Trusted…

AI
개발도구
읽기
2026년 5월 14일

UiPath for Coding Agents — coding agent 경쟁이 생성 성능에서 orchestration layer와 governance로 이동

UiPath는 2026년 5월 12일 UiPath for Coding Agents를 발표했다. Claude Code, Codex 등 서로 다른 coding agent가 생성한 결과를 하나의 UiPath orchestration layer 위에서 create, test, deploy, operate, govern할 수 있게 하고, policy enforcement, audit trail,…

AI
에이전트
읽기
2026년 5월 13일

OpenAI Daybreak — AI 코딩 보안이 사후 점검에서 지속적 cyber defense control plane으로 이동

OpenAI는 2026년 5월 12일 무렵 공개된 Daybreak 페이지에서 Codex 기반의 cyber defense 구상을 제품 표면으로 끌어올렸다. GPT-5.5, GPT-5.5 with Trusted Access for Cyber, GPT-5.5-Cyber의 3단계 접근 모델과 함께 secure code review, patch validation, dependency risk…

AI
OpenAI
읽기
2026년 5월 13일

OpenAI Deployment Company — frontier AI 경쟁이 모델 API 판매에서 FDE 기반 운영 전환 서비스로 이동

OpenAI는 2026년 5월 11일 OpenAI Deployment Company를 출범시키며 Tomoro 인수와 함께 약 150명의 Forward Deployed Engineers(FDE)를 초기 전력으로 편입한다고 밝혔다. OpenAI가 다수의 투자사·컨설팅사와 함께 40억 달러 이상 초기 자금을 바탕으로 별도 사업 단위를 세우고, 고객 워크플로 재설계와 production…

AI
OpenAI
읽기
2026년 5월 13일

Your car with Google built-in is about to get smarter, thanks to Gemini — Gemini 확장이 앱을 넘어 내장형 OS와 EV UX로 들어간다

Google은 2026년 4월 30일 공식 블로그에서 Gemini가 cars with Google built-in에 롤아웃되며 Google Assistant를 대체한다고 밝혔다. 자연어 기반 내비게이션, 메시지 요약/응답, 차량 설명서 기반 질의응답, EV 배터리·충전 맥락 질의, Gemini Live 기반 브레인스토밍까지 포함되며, 신규 차량뿐 아니라 기존 차량에도 software…

AI
Gemini
읽기
2026년 5월 12일

Chrome DevTools 148 — agentic web 경쟁이 브라우저 자동화에서 WebMCP 디버깅 표준으로 이동

Chrome DevTools 148은 2026년 5월 5일 공개되었고, DevTools MCP server/CLI를 0.25.0으로 올리면서 Chrome extension debugging, experimental WebMCP tool calling, Lighthouse의 Agentic Browsing audit category를 추가했다. 동시에 full-page accessibility…

AI
개발도구
읽기
2026년 5월 12일

DeepSeek-V4 — open frontier model 경쟁이 context length 표기보다 agent runtime 효율로 이동

DeepSeek-V4는 2026년 4월 24일 공개된 open MoE 계열로, DeepSeek-V4-Pro는 총 1.6T 파라미터 중 49B 활성, Flash는 284B 중 13B 활성 구조를 쓴다. 두 모델 모두 1M-token context를 지원하고, V4-Pro는 1M 토큰에서 V3.2 대비 single-token inference FLOPs를 27% 수준으로 낮추고 KV cache…

AI
모델
읽기
2026년 5월 12일

Mistral SDK supply-chain advisory — AI 개발도구 리스크가 모델 품질보다 패키지 공급망 검증으로 이동

Mistral은 2026년 5월 12일 TanStack supply chain attack affecting Mistral AI SDK packages advisory를 게시했다. 노출 구간 동안 npm 패키지 @mistralai/mistralai 2.2.2~2.2.4, Azure/GCP 변형 1.7.1~1.7.3, 그리고 PyPI mistralai==2.4.6가 영향권에 있었고, PyPI…

AI
개발도구
읽기
2026년 5월 12일

vLLM x Mooncake — agent 인프라 병목이 모델 추론보다 distributed KV cache 설계로 이동

vLLM은 2026년 5월 6일 Mooncake Store를 붙인 distributed KV cache pool 설계를 공개했다. Codex 기반 SWE-bench Pro trace 610개를 분석한 결과 agent session은 median 33 turns, 평균 input-to-output ratio 131:1, context가 trace당 12K에서 80K 토큰으로 커졌고, 이…

AI
에이전트
읽기
2026년 5월 11일

Databricks Unity AI Gateway — 에이전트·LLM·MCP를 하나의 거버넌스 계층으로 묶는 플랫폼화

Databricks는 2026년 5월 6~7일 기준 문서 업데이트를 통해 Unity AI Gateway와 새 agent/MCP 문서를 전면 공개했다. 이 Beta 계층은 LLM endpoint, coding agent, MCP server를 하나의 control plane에서 관리하고, multi-agent orchestration 템플릿은 OpenAI Agents SDK 기반으로…

AI
에이전트
읽기
2026년 5월 11일

EMO — MoE가 실제 배포 가능한 모듈형 모델로 진화할 수 있음을 보여준 AllenAI의 오픈 릴리즈

AllenAI는 2026년 5월 8일 EMO를 공개했다. 이 모델은 1B active / 14B total parameter, 128 experts, 1T tokens 규모의 MoE를 문서 단위 shared expert pool 제약으로 학습해, 전체 expert의 12.5%만 사용해도 near full-model 성능을 유지하도록 설계됐다.

AI
모델
읽기
2026년 5월 11일

IBM Think 2026 — agent 도입 경쟁이 보조 코파일럿에서 control plane과 SDLC 운영체계로 이동

IBM은 2026년 5월 5일 Think 2026에서 IBM Bob SaaS, watsonx Orchestrate 기반 agentic control plane, watsonx.data MCP server integration, OpenRAG, DataPower Interact Gateway 등을 한꺼번에 발표했다. 포인트는 개별 모델 발표보다, SDLC·데이터·보안·운영 계층 전체를…

AI
에이전트
읽기
2026년 5월 11일

Stable Animation SDK — 생성형 이미지 모델 경쟁이 정적 이미지에서 프로그래머블 모션 파이프라인으로 확장

Stability AI는 2026년 5월 11일 Stable Animation SDK를 발표했다. 이 SDK는 Stability의 animation endpoint를 통해 text-to-animation, image+text-to-animation, video+text-to-animation 세 경로를 제공하며, Stable Diffusion 2.0과 SDXL 계열 모델을 개발자용…

AI
API
읽기
2026년 5월 10일

Cursor 3.3 PR Review, Build in Parallel, and Split PRs — 코딩 에이전트 경쟁이 코드 생성에서 리뷰·병렬 실행 워크플로로 확장

Cursor는 2026년 5월 7일 Cursor 3.3에서 PR Review, Build in Parallel, Split PRs를 공개했다. 새 PR review UI는 review thread·top-level comment·commit history·changes tree를 한 화면에 모으고, Build in Parallel은 plan의 독립 작업을 비동기 subagent로 병렬…

AI
개발도구
읽기
2026년 5월 10일

Introducing agent quality optimization in AgentCore, now in preview — agent 운영의 병목이 프롬프트 수정이 아니라 trace 기반 품질 피드백 루프로 이동

AWS는 2026년 5월 4일 AgentCore의 agent quality optimization preview를 발표했다. 이 기능은 production trace를 기반으로 개선 권고를 생성하고, batch evaluation과 A/B testing으로 검증한 뒤 배포까지 이어지는 품질 개선 루프를 AgentCore 안에서 다루도록 설계됐다.

AI
에이전트
읽기
2026년 5월 10일

Microsoft Agent 365 now generally available — enterprise agent 도입의 초점이 개별 배포보다 조직 단위 관제·거버넌스로 이동

Microsoft는 2026년 5월 7일 Microsoft Agent 365의 general availability를 발표했다. Agent 365는 조직 전반의 AI agent를 관측·관리·보호하는 control plane으로, Defender·Intune 기반 shadow AI 탐지, unmanaged agent 차단, Entra network controls, AWS·Google 연동…

AI
에이전트
읽기
2026년 5월 10일

Secure AI agents with Amazon Bedrock AgentCore Identity on Amazon ECS — agent 보안의 핵심이 API 키 저장이 아니라 사용자 위임 세션 결속으로 이동

AWS는 2026년 5월 5일 Amazon Bedrock AgentCore Identity를 Amazon ECS에서 사용하는 참조 아키텍처를 공개했다. 이 구현은 Authorization Code Grant(3-legged OAuth), session binding, scoped token, token vault를 조합해 agent가 사용자 대신 GitHub 같은 외부 서비스에 접근할 때…

AI
에이전트
읽기
2026년 5월 9일

Higher usage limits for Claude and a compute deal with SpaceX — AI 제품 경쟁의 병목이 모델 품질에서 compute allocation과 요금제 운영으로 이동

Anthropic은 2026년 5월 6일 Claude Code와 Claude API의 사용 한도를 상향한다고 발표했다. Pro·Max·Team·seat-based Enterprise의 5시간 한도를 2배로 늘리고, Pro·Max의 피크 시간대 제한을 없앴으며, 동시에 SpaceX Colossus 1 데이터센터의 전체 compute capacity를 확보해 300MW 이상, 22만 개가 넘는…

AI
Claude
읽기
2026년 5월 9일

More flexible secrets and variables for Copilot cloud agent — 코딩 에이전트 운영의 핵심이 repo별 설정에서 조직 공통 control plane으로 이동

GitHub는 2026년 5월 8일 Copilot cloud agent 전용 Agents secrets and variables를 출시했다. 이제 background development environment에서 동작하는 cloud agent에 필요한 secret과 variable을 repository별 copilot environment에 따로 넣지 않고, 조직 수준에서 공유·제어할 수…

AI
개발도구
읽기
2026년 5월 9일

NVIDIA and ServiceNow Partner on New Autonomous AI Agents for Enterprises — desktop agent 경쟁이 모델 성능에서 governed runtime으로 이동

NVIDIA와 ServiceNow는 2026년 5월 5일 기업용 자율 에이전트 협업을 확대한다고 발표했다. ServiceNow는 로컬 파일시스템·터미널·설치 앱에 접근할 수 있는 장기 실행형 desktop agent Project Arc를 공개했고, 이 에이전트는 NVIDIA OpenShell이라는 오픈소스 sandboxed runtime과 ServiceNow AI Control…

AI
에이전트
읽기
2026년 5월 8일

Agents that transact: Introducing Amazon Bedrock AgentCore Payments, built with Coinbase and Stripe — 에이전트 경제가 결제 실험에서 런타임 인프라로 이동

AWS는 2026년 5월 7일 Amazon Bedrock AgentCore Payments preview를 발표했다. 이 기능은 AI agent가 APIs, MCP servers, web content, 다른 agents 같은 유료 리소스에 접근할 때 Coinbase·Stripe 기반 지갑을 통해 실행 루프 안에서 즉시 micropayment를 처리하고, 세션별 spending limit와…

AI
에이전트
읽기
2026년 5월 8일

Better customer experiences. Built on Sierra — AI 에이전트 자금이 모델 실험보다 운영 성과형 워크플로로 몰리는 신호

Sierra는 2026년 5월 4일 Tiger Global과 GV 주도로 9억5천만 달러를 조달했고 기업가치는 150억 달러를 넘었다고 밝혔다. 회사는 현재 40% 이상의 Fortune 50을 고객으로 확보했으며, 자사 플랫폼 위 agent가 refinance, claims processing, returns, fundraising 등에서 수십억 건의 customer interaction을…

AI
에이전트
읽기
2026년 5월 8일

Introducing OS Level Actions in Amazon Bedrock AgentCore Browser — 브라우저 에이전트가 DOM 자동화를 넘어 OS 제어로 확장

AWS는 2026년 5월 5일 Amazon Bedrock AgentCore Browser에 OS Level Actions를 추가했다. 이제 agent는 InvokeBrowser API를 통해 mouse click, move, drag, scroll, key type, key press, shortcut, screenshot 등 8개 액션을 사용해 DOM 바깥의 native dialog와…

AI
에이전트
읽기
2026년 5월 8일

Modernize your workflows: Amazon WorkSpaces now gives AI agents their own desktop (preview) — 레거시 앱이 API 없이도 에이전트 대상이 되는 전환점

AWS는 2026년 5월 5일 Amazon WorkSpaces가 AI agent 전용 desktop access를 public preview로 지원한다고 발표했다. agent는 기존 WorkSpaces 환경 안에서 IAM 인증, CloudTrail·CloudWatch audit, MCP endpoint, computer input과 computer vision 기능을 사용해 데스크톱 앱을…

AI
에이전트
읽기
2026년 5월 7일

Advancing voice intelligence with new models in the API — voice AI 경쟁이 STT/TTS를 넘어 realtime agent runtime으로 이동

OpenAI는 2026년 5월 7일 Realtime API용 새 음성 모델 3종 GPT-Realtime-2, GPT-Realtime-Translate, GPT-Realtime-Whisper를 공개했다. GPT-Realtime-2는 컨텍스트 윈도를 32K에서 128K로 늘리고 병렬 tool call, 조정 가능한 reasoning effort, 더 강한 recovery behavior를…

AI
OpenAI
읽기
2026년 5월 7일

CAISI Signs Agreements Regarding Frontier AI National Security Testing — frontier AI 거버넌스가 사후 규제보다 사전 평가 체계로 이동

미국 NIST 산하 CAISI는 2026년 5월 5일 Google DeepMind, Microsoft, xAI와 frontier AI 국가안보 테스트 협약을 체결했다고 발표했다. 이 협약에 따라 CAISI는 공개 전 모델 평가, 배포 후 평가, 표적 연구를 수행하며, 현재까지 40건 이상 평가를 완료했다고 밝혔다.

AI
산업
읽기
2026년 5월 7일

Enterprise-managed plugins in GitHub Copilot CLI are now in public preview — 코딩 에이전트 도입이 개인 설정에서 중앙 통제형 배포로 이동

GitHub는 2026년 5월 6일 Enterprise-managed plugins가 GitHub Copilot CLI에서 public preview에 들어갔다고 발표했다. 관리자는 .github-private/.github/copilot/settings.json을 통해 플러그인 마켓플레이스, 자동 설치 플러그인, 항상 활성화할 hooks와 MCP 구성을 중앙에서 배포할 수 있다.

AI
에이전트
읽기
2026년 5월 7일

Secret scanning with GitHub MCP Server is now generally available — AI 코딩 보안이 PR 이후 탐지에서 pre-commit agent guardrail로 이동

GitHub는 2026년 5월 5일 GitHub MCP Server의 secret scanning 기능이 general availability에 들어갔다고 발표했다. 이제 MCP 호환 AI 코딩 에이전트와 IDE가 커밋이나 PR 전에 노출된 secret을 직접 스캔할 수 있고, 기존 push protection customization도 그대로 존중한다.

AI
개발도구
읽기
2026년 5월 7일

Browser Harness - LLM 기반 자가치유 브라우저 자동화 프레임워크

Browser Harness는 LLM이 Chrome DevTools Protocol(CDP)을 통해 브라우저 작업을 직접 수행하되, 필요한 헬퍼 코드를 실행 중 스스로 생성하는 자가치유(self-healing) 자동화 프레임워크다. 핵심 코드가 ~1,000줄에 불과한 초경량 구조.

AI
오픈소스
읽기
2026년 5월 6일

Agents for financial services — vertical agent 경쟁이 generic chat보다 workflow package와 governed data access로 이동

Anthropic은 2026년 5월 5일 금융업무용 ready-to-run agent template 10종을 공개했다. pitchbook 작성, KYC screening, month-end close 같은 업무를 위한 템플릿이 Claude Cowork·Claude Code plugin과 Claude Managed Agents cookbook 형태로 제공되며,…

AI
Claude
읽기
2026년 5월 6일

Gemini API File Search is now multimodal — RAG 경쟁이 text retrieval에서 multimodal evidence layer로 이동

Google은 2026년 5월 5일 Gemini API File Search에 multimodal support, custom metadata, page-level citations를 추가했다. 이제 텍스트와 이미지를 함께 색인·검색할 수 있고, metadata filter로 검색 범위를 줄이며, 응답마다 원문 페이지 단위 citation을 붙여 verifiable RAG를 구성할 수 있다.

AI
Gemini
읽기
2026년 5월 6일

GPT-5.5 Instant — 범용 AI 제품 경쟁이 frontier launch보다 기본 모델 운영 품질로 이동

OpenAI는 2026년 5월 5일 ChatGPT의 기본 모델을 GPT-5.5 Instant로 교체한다고 발표했다. 새 모델은 GPT-5.3 Instant 대비 고위험 프롬프트에서 hallucinated claim을 52.5% 줄였고, 사용자가 오류를 지적했던 까다로운 대화에서는 inaccurate claim을 37.3% 줄였으며, chat-latest로도 제공된다.

AI
OpenAI
읽기
2026년 5월 6일

NVIDIA extreme co-design — agent 인프라 경쟁이 모델 FLOPs보다 token economics 최적화로 이동

NVIDIA는 2026년 5월 5일 agentic workload의 토큰 경제성을 분석하며, Claude Code 세션 예시에서 33분 동안 283개 inference request, 225개 sub-agent invocation, 15K→156K token context 성장 후 20K로 compaction 되는 패턴을 공개했다. 회사는 이를 해결하기 위해 Vera Rubin NVL72,…

AI
에이전트
읽기
2026년 5월 5일

Accelerating Gemma 4: faster inference with multi-token prediction drafters — 오픈모델 경쟁의 기준이 benchmark보다 latency economics로 이동

Google은 2026년 5월 5일 Gemma 4용 Multi-Token Prediction (MTP) drafters를 공개했다. 이 speculative decoding 구조는 Gemma 4 target model과 경량 drafter를 결합해 output 품질 저하 없이 최대 3배 속도 향상을 제공하며, Gemma 4는 출시 수주 만에 6천만 다운로드를 넘겼다고 밝혔다.

AI
오픈소스
읽기
2026년 5월 5일

Advancing AI evaluation with the Center for AI Standards and Innovation and the AI Security Institute — frontier AI 경쟁이 capability race에서 평가 인프라 경쟁으로 확장

Microsoft는 2026년 5월 5일 미국 CAISI와 영국 AISI와의 신규 협력을 발표하며 frontier model 테스트, safeguard 평가, 국가안보·대규모 공공안전 리스크 완화 연구를 공동으로 진행하겠다고 밝혔다. 미국 측에서는 NIST와 adversarial assessment 방법론, 공유 프레임워크·데이터셋·workflow를 개발하고, 영국 측에서는…

AI
산업
읽기
2026년 5월 5일

Reduce friction and latency for long-running jobs with Webhooks in Gemini API — agent 런타임의 핵심이 polling이 아니라 event-driven orchestration으로 이동

Google은 2026년 5월 4일 Gemini API에 Webhooks를 도입해 Batch API·Deep Research·장시간 생성 작업의 완료 이벤트를 HTTP POST로 push할 수 있게 했다. 구현은 Standard Webhooks 스펙을 따르며 webhook-signature, webhook-id, webhook-timestamp 기반 서명, 최대 24시간 자동 재시도,…

AI
API
읽기
2026년 5월 4일

Building a new enterprise AI services company with Blackstone, Hellman & Friedman, and Goldman Sachs

Anthropic은 2026년 5월 4일 Blackstone, Hellman & Friedman, Goldman Sachs와 함께 중견기업 대상의 새 enterprise AI services 회사를 만든다고 발표했다. 이 조직은 Anthropic Applied AI 인력과 현장 엔지니어링 팀을 결합해 Claude 기반 업무 시스템을 설계·구축·운영하는 delivery layer 역할을…

AI
Claude
읽기
2026년 5월 4일

From capability to responsibility: Securing our global digital ecosystem with next-generation AI

Microsoft는 2026년 5월 1일 frontier AI가 vulnerability discovery를 급격히 가속하고 있다며, pre-deployment evaluation, phased access, vulnerability coordination, faster remediation, international coordination을 포함한 5대 security 원칙을 제시했다.…

AI
산업
읽기
2026년 5월 4일

Powering AI, Strengthening the Grid: Innovation in Space Solar Energy and Long-Duration Storage

Meta는 2026년 4월 28일 AI 인프라와 데이터센터 전력을 위해 Overview Energy와 Noon Energy에 각각 최대 1 GW의 space solar capacity와 1 GW/100 GWh의 ultra-long-duration storage capacity를 예약했다고 발표했다. 초기 Noon pilot은 25 MW/2.5 GWh 규모로 2028년 완료를 목표로 한다.

AI
산업
읽기
2026년 5월 4일

ReasoningBank: Enabling agents to learn from experience

Google Research는 2026년 4월 21일 ReasoningBank를 공개했다. 이 프레임워크는 에이전트의 성공·실패 경험을 구조화된 reasoning memory로 증류하고, memory-aware test-time scaling(MaTTS)과 결합해 WebArena와 SWE-Bench-Verified에서 성공률과 효율을 함께 끌어올렸다.

AI
에이전트
읽기
2026년 5월 3일

GitHub Copilot GPT-5.2 계열 deprecation — 코딩 AI 운영의 핵심이 최신 모델 채택과 lifecycle 관리로 이동

GitHub는 2026년 5월 1일 Copilot 전반에서 GPT-5.2와 GPT-5.2-Codex를 2026년 6월 1일부로 deprecated한다고 공지했다. 대체 경로는 각각 GPT-5.5와 GPT-5.3-Codex이며, Copilot Enterprise 관리자는 model policy에서 대체 모델 활성화를 미리 확인해야 한다.

AI
개발도구
읽기
2026년 5월 3일

Introducing Advanced Account Security — AI 계정 보안이 부가 기능에서 워크플로 인프라로 승격

OpenAI는 2026년 4월 30일 ChatGPT와 Codex에 공통 적용되는 Advanced Account Security를 공개했다. 이 설정은 passkey·physical security key 강제, 이메일/SMS 기반 복구 비활성화, 세션 단축, 로그인 알림, 그리고 자동 training exclusion을 한 번에 묶은 opt-in 보안 모드다.

AI
OpenAI
읽기
2026년 5월 3일

Microsoft Agent 365 GA — 에이전트 도입 경쟁이 생성 성능에서 관리·보안 control plane으로 이동

Microsoft는 2026년 5월 1일 Agent 365의 general availability를 발표했다. Agent 365는 delegated access agent와 own-credential agent를 모두 대상으로 observability, governance, security를 제공하는 control plane이며, shadow AI 탐지와 Windows 365 for…

AI
에이전트
읽기
2026년 5월 2일

GitHub Copilot usage-based billing — 에이전트형 코딩 도구의 수익모델이 좌석제가 아니라 토큰 운영으로 이동

GitHub는 2026년 6월 1일부터 모든 Copilot 플랜을 premium request 기반에서 GitHub AI Credits 기반 사용량 과금으로 전환한다고 발표했다. 과금 단위는 요청 수가 아니라 input·output·cached token 사용량이며, 조직은 pooled credits와 budget controls로 초과 사용을 제어할 수 있다.

AI
개발도구
읽기
2026년 5월 2일

Microsoft Sovereign Private Cloud on Azure Local — AI 인프라 경쟁이 모델 접근성에서 관할권 통제와 로컬 실행으로 이동

Microsoft는 2026년 4월 27일 Azure Local 기반 Sovereign Private Cloud가 단일 sovereign environment 안에서 수천 대 서버 규모까지 확장된다고 발표했다. 검증된 compute/storage 파트너 스택과 Intel Xeon 6의 AMX AI acceleration을 결합해, 데이터·모델·실행을 고객 관할 경계 안에 둔 채 대규모 AI…

AI
산업
읽기
2026년 5월 2일

NVIDIA Nemotron 3 Nano Omni — multimodal agent 스택이 모델 조합에서 단일 perception sub-agent로 수렴

NVIDIA는 2026년 4월 28일 vision·audio·video·text를 한 모델에서 처리하는 오픈 multimodal reasoning model Nemotron 3 Nano Omni를 발표했다. 이 모델은 30B-A3B hybrid MoE, 256K context를 기반으로 document intelligence·video/audio understanding…

AI
오픈소스
읽기
2026년 5월 1일

Introducing IBM Bob — AI-assisted coding에서 governed SDLC orchestration으로 무게중심 이동

IBM은 2026년 4월 28일 enterprise용 AI development partner IBM Bob을 공개했다. Bob은 코드 생성에 그치지 않고 planning·coding·testing·deployment·modernization 전반을 다루며, task별로 Claude·Mistral·Granite 등 여러 모델을 비용·정확도 기준으로 자동 라우팅한다.

AI
개발도구
읽기
2026년 5월 1일

Snowflake Intelligence and Cortex Code — enterprise AI control plane 경쟁이 MCP·plugin·cloud agent로 확장

Snowflake는 2026년 4월 21일 Snowflake Intelligence와 Cortex Code 업데이트를 발표하며, enterprise AI의 control plane 포지션을 강화했다. Cortex Code는 AWS Glue·Databricks·Postgres 지원 확대, MCP/ACP 연동, VS Code extension과 Claude Code plugin,…

AI
에이전트
읽기
2026년 5월 1일

The AI engineering stack we built internally — agent 도입 경쟁이 모델 선택에서 사내 infra maturity로 이동

Cloudflare는 2026년 4월 20일 자사 내부 AI engineering stack을 공개하며, 최근 30일 기준 R&D 조직의 93%가 사내 AI 코딩 도구를 사용했고 AI Gateway를 통해 241.37B tokens, Workers AI에서 51.47B input tokens를 처리했다고 밝혔다. 다음 단계로는 MCP portal, git, test runner를 그대로…

AI
개발도구
읽기
2026년 5월 1일

Warp is now open-source — ADE 경쟁이 제품 기능에서 오픈 에이전트 운영체제로 확장

Warp는 2026년 4월 28일 Warp client를 AGPL로 오픈소스화하고, Oz 기반 agent-first 기여 워크플로를 공개했다. 동시에 Kimi·MiniMax·Qwen 지원 확대, auto (open) 모델 라우팅, 설정 파일 추가로 IDE/ADE를 더 개방형 표면으로 재구성했다.

AI
오픈소스
읽기
2026년 4월 30일

An update on recent Claude Code quality reports — 에이전트 품질 경쟁이 모델 성능만이 아니라 제품 레이어 운영 규율로 이동

Anthropic은 2026년 4월 23일 Claude Code 품질 저하 보고에 대한 사후분석을 공개했다. 원인은 모델 열화가 아니라 제품 레이어의 세 가지 변경으로, 기본 reasoning effort를 high에서 medium으로 낮춘 결정, 1시간 이상 idle 세션에서 thinking history를 반복 삭제한 캐시 버그, 그리고 4월 16일 도입했다가 4월 20일 되돌린…

AI
Claude
읽기
2026년 4월 30일

Prepay for the Gemini API to get more control over your spend — 에이전트 경제성이 기능보다 먼저 제품 표면으로 올라오다

Google은 2026년 4월 15일 Google AI Studio용 Gemini API Prepay Billing을 발표했다. 신규 Google Cloud Billing Account를 여는 미국 사용자부터 선불 크레딧 기반 결제를 쓸 수 있고, 자동 충전과 함께 남은 잔액을 기준으로 API 호출 비용을 관리하게 해 spend predictability를 높이겠다는 내용이다.

AI
Gemini
읽기
2026년 4월 30일

Qwen3.6 — 오픈 코딩 모델 경쟁이 벤치마크보다 저장된 추론과 레포 단위 작업 완성도로 이동

Qwen 팀은 2026년 4월 Qwen3.6 시리즈를 공개하며 35B-A3B와 27B 모델을 순차 배포했다. 공식 저장소 기준으로 이번 릴리스는 agentic coding, front-end workflow, repository-level reasoning 강화와 함께 conversation history 전반에 thinking context를 유지하는 Thinking…

AI
모델
읽기
2026년 4월 30일

Building the compute infrastructure for the Intelligence Age — AI 경쟁의 핵심 변수가 모델에서 전력·부지·시공 속도로 이동

OpenAI는 2026년 4월 29일 Stargate를 통해 2029년 목표였던 미국 내 10GW AI infrastructure 확보를 이미 넘어섰고, 최근 90일에만 3GW 이상을 추가했다고 밝혔다. 또한 GPT-5.5가 Texas Abilene의 Oracle Cloud Infrastructure와 NVIDIA GB200 systems 위에서 학습됐다고 공개했다.

AI
OpenAI
읽기
2026년 4월 30일

Native Deployment Checks are now available — CI 품질 게이트가 빌드 외부 도구에서 배포 플랫폼 기본 기능으로 이동

Vercel은 2026년 4월 28일 Native Deployment Checks를 공개했다. 팀은 이제 각 deployment마다 package.json의 lint와 typecheck 스크립트를 build와 병렬로 실행할 수 있고, check를 required로 지정해 production 진입을 막을 수 있으며, 실패 시 Vercel Agent가 원인 분석과 수정 제안을 제공한다.

AI
개발도구
읽기
2026년 4월 30일

Parallel Raises at $2 Billion Valuation to Scale Web Infrastructure for Agents — 에이전트 시대의 병목이 모델이 아니라 웹 접근 인프라로 이동

Parallel Web Systems는 2026년 4월 29일 Sequoia 주도로 1억 달러 Series B를 유치하며 기업가치 20억 달러를 기록했다고 발표했다. 회사는 AI agents가 open web를 검색·추출·모니터링할 수 있도록 하는 infrastructure layer를 제공하며, 총 누적 투자금은 2억3000만 달러로 늘었다.

AI
에이전트
읽기
2026년 4월 28일

An open-source spec for Codex orchestration: Symphony — 코딩 에이전트 운영의 병목이 모델이 아니라 인간의 세션 관리로 드러나다

OpenAI는 2026년 4월 27일 Symphony를 공개했다. Symphony는 Linear 같은 이슈 트래커를 coding agents의 control plane으로 삼는 오픈소스 orchestration spec이며, 각 티켓을 격리된 workspace와 장기 실행 세션에 매핑해 자동 재시도·상태 추적·handoff를 관리한다.

AI
OpenAI
읽기
2026년 4월 28일

Introducing workspace agents in ChatGPT — GPTs 이후의 경쟁축이 개인 보조에서 팀 단위 운영 자동화로 이동

OpenAI는 2026년 4월 22일 ChatGPT용 workspace agents를 발표했다. Codex 기반으로 동작하는 이 agents는 공유된 조직 맥락과 권한 체계 안에서 보고서 작성, 코드 생성, 메시지 응답, Slack 연동, 일정 기반 실행 같은 장기 워크플로를 수행하며, ChatGPT Business·Enterprise·Edu·Teachers 플랜에서 research…

AI
OpenAI
읽기
2026년 4월 28일

OpenAI models, Codex, and Managed Agents come to AWS — frontier AI가 단일 벤더 API에서 클라우드 내장형 엔터프라이즈 배포로 이동

OpenAI와 AWS는 2026년 4월 28일 전략적 파트너십 확대를 발표하며 GPT-5.5를 포함한 OpenAI models, Codex, 그리고 Amazon Bedrock Managed Agents를 AWS 환경에서 제한적 프리뷰로 제공하기 시작했다. 기업은 이제 Bedrock의 보안·ID·조달 체계 안에서 OpenAI 모델과 코딩 에이전트, multi-step agent…

AI
OpenAI
읽기
2026년 4월 28일

Anthropic and NEC collaborate to build Japan’s largest AI engineering workforce — AI-native engineering이 실험 조직에서 전사 역량으로 이동

Anthropic은 2026년 4월 24일 NEC와의 전략적 협업을 발표하며 Claude를 약 3만 명의 NEC Group 직원에게 배포하고, 일본 시장용 산업 특화 AI 제품을 공동 개발한다고 밝혔다. 협업 범위에는 Claude Opus 4.7, Claude Code, Claude Cowork, NEC BluStellar 프로그램, 그리고 finance·manufacturing·local…

AI
Claude
읽기
2026년 4월 28일

OpenAI available at FedRAMP Moderate — frontier AI 도입의 병목이 모델 성능에서 인증 가능한 보안 운영으로 이동

OpenAI는 2026년 4월 27일 ChatGPT Enterprise와 API Platform이 FedRAMP 20x Moderate authorization을 획득했다고 발표했다. 이에 따라 미국 연방기관은 보안·프라이버시·거버넌스 요구사항을 충족하는 환경에서 GPT-5.5를 포함한 OpenAI 관리형 제품을 활용할 수 있고, 향후 FedRAMP 환경에서 Codex Cloud 접근도…

AI
OpenAI
읽기
2026년 4월 28일

The next phase of the Microsoft OpenAI partnership — frontier AI 공급망이 단일 클라우드 종속에서 다중 클라우드+비독점 IP 체제로 이동

OpenAI는 2026년 4월 27일 Microsoft와의 파트너십 개정안을 발표했다. 핵심 변경점은 OpenAI 제품의 멀티클라우드 판매 허용, Microsoft의 2032년까지 비독점 IP 라이선스 유지, Microsoft의 OpenAI 매출분배 종료, 그리고 2030년까지 capped revenue-share 구조 유지다.

AI
OpenAI
읽기
2026년 4월 26일

Nemotron-Personas-Korea — 한국 실제 분포 기반 합성 페르소나 데이터셋

NVIDIA가 공개한 한국어 합성 페르소나 데이터셋으로, 한국의 공개 통계와 지역·직업·교육 등 사회적 분포를 바탕으로 100만 개 규모의 페르소나 레코드를 구성한 자료다. 한국어 모델 학습과 시뮬레이션에서 한국형 맥락을 반영하는 데 참고할 수 있다. 소버린 AI, 한국어 LLM 학습, 합성 데이터 다양성 확대 관점에서 볼 만하다. 영어권 중심 페르소나 데이터셋으로는 놓치기 쉬운 지역성과…

AI
모델
읽기
2026년 4월 25일

DeepSeek V4 Preview — 오픈 모델 경쟁이 성능 추격에서 가격·맥락 길이·지정학적 자립성의 복합전으로 이동

DeepSeek는 2026년 4월 24일 V4 Preview를 공개했다. V4 Pro는 1.6T total / 49B active parameters, V4 Flash는 284B total / 13B active parameters를 갖고 두 모델 모두 1M token context를 지원하며, Flash는 입력 토큰 100만 개당 0.14달러로 제시됐다.

AI
모델
읽기
2026년 4월 25일

GitHub gh skill — 에이전트 활용도가 개별 프롬프트에서 재사용 가능한 작업 패키지 유통으로 이동

GitHub는 2026년 4월 16일 GitHub CLI용 gh skill을 공개했다. 이 명령은 agent skills를 검색·설치·업데이트·배포할 수 있게 하며, Claude Code, Codex, Cursor, Copilot, Gemini CLI 등 여러 agent host를 지원하고, tag pinning·tree SHA 기록·immutable releases 권장으로 공급망…

AI
개발도구
읽기
2026년 4월 25일

Mistral 3 — 오픈 모델 경쟁이 단일 플래그십에서 full-stack open portfolio 전략으로 이동

Mistral AI는 최근 Mistral 3를 공개하며 675B total / 41B active의 Mistral Large 3와 3B·8B·14B 규모의 Ministral 3 시리즈를 함께 내놨다. 전 모델을 Apache 2.0으로 공개하고, Large 3는 8×A100 또는 8×H100 단일 노드 배포 경로, 소형 모델은 edge·robotics 환경까지 겨냥하며 배포 범위를 넓혔다.

AI
모델
읽기
2026년 4월 24일

ChatGPT for Clinicians — 의료 AI 경쟁이 범용 챗봇에서 검증된 임상 워크스페이스로 이동

OpenAI는 2026년 4월 22일 미국의 검증된 physician, NP, PA, pharmacist에게 무료로 제공되는 ChatGPT for Clinicians를 공개했다. 이 제품은 trusted clinical search, cited deep research, reusable skills, CME 연동을 포함하며, OpenAI는 700,000건 이상의 health response…

AI
OpenAI
읽기
2026년 4월 24일

GitHub Copilot Individual plan changes — 코딩 에이전트 시장이 기능 경쟁에서 수익성·할당 통제로 이동

GitHub는 2026년 4월 20일 Copilot Individual 요금제 조정을 발표하며 신규 Pro, Pro+, Student 가입을 일시 중단하고, usage limit를 강화하고, Opus 계열 모델의 Pro 제공을 중단한다고 밝혔다. GitHub는 agentic workflow의 병렬·장기 세션이 원래 요금제 구조보다 훨씬 높은 compute cost를 발생시키고 있으며,…

AI
개발도구
읽기
2026년 4월 24일

GPT-Rosalind for life sciences — frontier model 경쟁이 범용 지능에서 도메인 특화 연구 워크플로로 확장

OpenAI는 2026년 4월 16일 biology, drug discovery, translational medicine 연구용 모델인 GPT-Rosalind를 research preview로 공개했다. 이 모델은 ChatGPT, Codex, API에서 qualified customer 대상으로 제공되며, LABBench2의 11개 과제 중 6개에서 GPT-5.4를 앞섰고, Codex 앱…

AI
OpenAI
읽기
2026년 4월 24일

Introducing GPT-5.5 — 에이전트형 지식노동의 병목이 모델 성능보다 실행 효율과 자율성 설계로 이동

OpenAI는 2026년 4월 23일 GPT-5.5를 공개했고, 4월 24일에는 API 제공까지 시작했다. GPT-5.5는 Terminal-Bench 2.0에서 82.7%, SWE-Bench Pro에서 58.6%, GDPval에서 84.9%, OSWorld-Verified에서 78.7%를 기록하며 GPT-5.4 대비 더 높은 성능과 더 낮은 토큰 사용량을 동시에 내세웠다.

AI
OpenAI
읽기
2026년 4월 23일

Claude Code to be removed from Anthropic's Pro plan?

Anthropic은 가격 페이지를 기준으로 월 20달러 프로 구독에서 Claude Code를 제거한 것으로 보입니다. 누가 20달러 계획을 갖고 있는지 확인할 수 있는 사람이 있나요? clude.com/pricing

트렌드
AI
읽기
2026년 4월 23일

ChatGPT Images 2.0

ChatGPT Images 2.0 소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 22일

Google Cloud Next '26 — agent 플랫폼 경쟁이 모델 호스팅에서 full-stack agent operating system으로 이동

Google은 2026년 4월 22일 Cloud Next '26에서 Gemini Enterprise Agent Platform과 8세대 TPU 8t·8i를 공개했다. Agent Platform은 Vertex AI를 사실상 agent 전용 control plane으로 재편하며, Google은 고객 API 트래픽이 분기당 100억 토큰/분에서 160억 토큰/분으로 늘었고 ADK를 통한…

AI
트렌드
읽기
2026년 4월 22일

Meta-Broadcom custom silicon 확대 — frontier AI 경쟁이 GPU 조달에서 workload-specific silicon 설계 능력으로 이동

Meta는 2026년 4월 14일 Broadcom과 차세대 MTIA(Meta Training and Inference Accelerator) 칩을 다세대 공동개발한다고 발표했다. Meta는 향후 2년 내 MTIA 4세대를 개발·배치하고, 1GW를 넘는 초기 배치를 시작으로 장기적으로 multi-gigawatt 규모의 custom silicon 인프라를 확대하겠다고 밝혔다.

AI
트렌드
읽기
2026년 4월 22일

OpenAI Privacy Filter — privacy 인프라가 규칙 기반 필터에서 로컬 실행 가능한 specialist model로 이동

OpenAI는 2026년 4월 22일 PII 탐지·마스킹용 open-weight 모델인 Privacy Filter를 공개했다. 이 모델은 최대 128K 컨텍스트를 지원하는 1.5B 파라미터급 token-classification 모델로, PII-Masking-300k 기준 96% F1과 수정 평가셋 기준 97.43% F1을 제시하며 Apache 2.0 라이선스로 Hugging Face와…

AI
OpenAI
읽기
2026년 4월 21일

Agent Governance Toolkit — 에이전트 보안이 사후 감사에서 runtime kernel 계층으로 이동

Microsoft는 2026년 4월 2일 Agent Governance Toolkit을 MIT 라이선스로 공개했다. 이 오픈소스 프로젝트는 OWASP Agentic AI Top 10의 10개 위험군을 모두 다루는 runtime governance stack을 목표로 하며, Agent OS·Mesh·Runtime·SRE·Compliance·Marketplace·Lightning의 7개…

AI
트렌드
읽기
2026년 4월 21일

Anthropic-Amazon 5GW 계약 — frontier AI 경쟁이 모델 성능에서 전력·칩·클라우드 확보전으로 이동

Anthropic은 2026년 4월 20일 Amazon과 협력을 확대해 Claude 학습·서빙용으로 최대 5GW 규모의 신규 컴퓨트 용량을 확보한다고 발표했다. Anthropic은 향후 10년간 AWS 기술에 1,000억 달러 이상을 투입하고, 2026년 말까지 Trainium2·Trainium3 기반으로 총 1GW에 가까운 용량이 순차적으로 가동될 예정이며, Claude Platform…

AI
트렌드
읽기
2026년 4월 21일

Deep Research Max — research agent가 웹 검색에서 MCP 기반 전문 조사 파이프라인으로 진화

Google DeepMind는 2026년 4월 21일 Gemini API용 Deep Research와 Deep Research Max를 공개했다. Gemini 3.1 Pro 기반으로 웹 검색, remote MCP, 파일 업로드, 연결 스토리지를 함께 탐색할 수 있고, Deep Research Max는 extended test-time compute를 사용해 더 깊은 조사와 합성을 수행한다.

AI
트렌드
읽기
2026년 4월 21일

Power Platform MCP Authoring — enterprise low-code가 live session 기반 agent 개발 표면으로 확장

Microsoft는 2026년 4월 9일 Power Platform 4월 업데이트에서 Canvas Apps MCP Authoring Plugin과 generative pages용 external tool 지원 확대를 발표했다. 사용자는 GitHub Copilot, Claude Code 등 MCP 호환 AI coding agent를 live Power Apps Studio 세션에 연결해…

AI
트렌드
읽기
2026년 4월 20일

OpenAI acquires TBPN — frontier AI 경쟁이 모델 우위에서 미디어·내러티브 통제력으로 확장

OpenAI는 2026년 4월 2일 Technology Business Programming Network(TBPN)를 인수했다고 발표했다. TBPN은 OpenAI Strategy 조직 산하로 들어가지만, OpenAI는 프로그램 운영과 게스트 선정 등 편집 독립성은 유지된다고 밝혔다.

AI
트렌드
읽기
2026년 4월 20일

Remote control CLI sessions on web and mobile — 코딩 에이전트 운영이 단일 터미널에서 원격 감독형 세션으로 이동

GitHub는 2026년 4월 13일 copilot --remote를 공개하며 Copilot CLI 세션을 웹과 GitHub Mobile에서 원격으로 모니터링하고 조종할 수 있는 기능을 public preview로 출시했다. 사용자는 다른 디바이스에서 실행 중인 세션의 활동을 보고, 중간 지시를 보내고, plan·interactive·autopilot 모드를 전환하며, 권한 요청 승인과…

AI
트렌드
읽기
2026년 4월 20일

Vercel April 2026 security incident — AI 도구 공급망이 개발자 인프라의 새로운 침투 경로가 되다

Vercel은 2026년 4월 20일 업데이트한 보안 공지에서, 내부 시스템 일부에 대한 무단 접근이 있었고 그 출발점이 직원이 사용하던 third-party AI 도구 Context.ai의 침해였다고 밝혔다. 공격자는 이 경로를 통해 Vercel Google Workspace 계정을 탈취했고, 민감(sensitive)으로 표시되지 않은 일부 환경변수에 접근한 것으로 조사됐다.

AI
트렌드
읽기
2026년 4월 20일

Vercel Flags GA — feature flag가 실험 도구를 넘어 앱 운영의 control plane으로 이동

Vercel은 2026년 4월 16일 Vercel Flags를 정식 출시했다고 발표했다. 이 기능은 Vercel Dashboard에서 targeting rules, user segments, environment controls를 관리하고, Next.js·SvelteKit용 Flags SDK와 OpenFeature 호환 어댑터를 통해 애플리케이션 코드에 바로 연결된다.

AI
트렌드
읽기
2026년 4월 20일

Molotov cocktail is hurled at home of Sam Altman

Molotov cocktail is hurled at home of Sam Altman 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 20일

The local LLM ecosystem doesn’t need Ollama

Ollama는 최초의 간편한 llama.cpp 래퍼로 인기를 얻었고, 다른 사람의 엔진에서 벌어들인 VC 자금을 활용하면서 속성을 피하고, 사용자를 오도하고, 클라우드로 전환하는 데 수년을 보냈습니다. 전체 기록과 대안이 더 나은 이유는 다음과 같습니다.

트렌드
AI
읽기
2026년 4월 20일

Voicebox — 로컬에서 음성 복제·TTS를 다루는 오픈소스 보이스 스튜디오

Voicebox는 음성 복제, 다국어 TTS, 후처리 효과, 멀티 보이스 편집을 한곳에서 다루는 로컬 우선 음성 합성 스튜디오다. 클라우드형 음성 서비스의 대안으로 제시되며, 여러 TTS 엔진을 바꿔가며 테스트하고 REST API로 앱에 붙일 수 있게 설계됐다. 볼 만한 이유는 단순한 모델 데모가 아니라 실제 제작 워크플로우에 가까운 구조를 갖췄기 때문이다. 몇 초짜리 샘플로 보이스…

오픈소스
무료
읽기
2026년 4월 19일

Anthropic, Claude Code의 third-party harness 과금을 분리 — 에이전트 경제성이 제품 경계로 재편된다

TechCrunch는 2026년 4월 4일 Anthropic이 Claude Code 구독자가 OpenClaw 같은 third-party harness를 사용할 경우 더 이상 기존 구독 한도를 쓸 수 없고, 별도 pay-as-you-go 과금이 적용된다고 보도했다. Anthropic은 이 정책이 OpenClaw부터 시작하지만 다른 third-party harness 전반으로 확대될 것이라고…

AI
트렌드
읽기
2026년 4월 19일

Gemini 3.1 Flash TTS: 음성 AI의 경쟁 축이 품질에서 제어 가능성으로 이동

Google은 2026년 4월 15일 Gemini 3.1 Flash TTS를 발표하고 Gemini API, Google AI Studio, Vertex AI, Google Vids에 preview로 배포하기 시작했다. 이 모델은 70개 이상 언어를 지원하고, Artificial Analysis TTS leaderboard에서 Elo 1,211을 기록했으며, natural-language…

AI
트렌드
읽기
2026년 4월 19일

Gemini Robotics-ER 1.6: Google이 embodied reasoning을 산업용 로봇 제어면으로 끌어올리다

Google DeepMind는 2026년 4월 14일 Gemini Robotics-ER 1.6을 공개하고 Gemini API와 Google AI Studio에서 즉시 사용할 수 있게 했다. 새 버전은 spatial reasoning, multi-view success detection, instrument reading을 강화했고, instrument reading 정확도는 agentic…

AI
트렌드
읽기
2026년 4월 19일

Measuring Claude 4.7's tokenizer costs

문서에서는 토큰이 1.0~1.35배 더 많다고 밝혔습니다. 실제 콘텐츠에서는 1.47x를 측정했습니다.

트렌드
AI
읽기
2026년 4월 18일

Enable Copilot cloud agent via custom properties — 에이전트 도입의 병목이 기능에서 조직별 거버넌스로 이동

GitHub는 2026년 4월 15일 Copilot cloud agent를 enterprise 전체가 아니라 특정 조직 단위로 선택적으로 활성화할 수 있는 기능을 추가했다. 관리자는 custom properties 또는 새 API endpoint를 이용해 selected organizations만 CCA를 허용할 수 있다.

AI
트렌드
읽기
2026년 4월 18일

Introducing Muse Spark — Meta가 consumer AI를 단일 챗봇에서 멀티모달 subagent 경험으로 재설계

Meta는 2026년 4월 8일 Meta Superintelligence Labs의 첫 모델인 Muse Spark를 공개했다. 이 모델은 현재 Meta AI 앱과 웹을 구동하며, 향후 WhatsApp·Instagram·Facebook·Messenger·AI glasses로 확장되고, select partners 대상 private preview API도 제공될 예정이다.

AI
트렌드
읽기
2026년 4월 18일

Model selection for Claude and Codex agents on GitHub.com — 코딩 에이전트 경쟁이 모델 자체에서 라우팅 권한으로 이동

GitHub는 2026년 4월 14일 github.com의 Claude·Codex third-party coding agent에 model selection을 추가했다. Claude 쪽은 Sonnet 4.6·Opus 4.6·Sonnet 4.5·Opus 4.5를, Codex 쪽은 GPT-5.2-Codex·GPT-5.3-Codex·GPT-5.4를 작업 시작 시 직접 고를 수 있다.

AI
트렌드
읽기
2026년 4월 18일

ShengShu raises $293 million to advance a general world model — 중국 AI 자본이 video generation에서 embodied intelligence로 이동

Reuters는 2026년 4월 10일 중국 AI 스타트업 ShengShu Technology가 Alibaba Cloud 주도의 라운드에서 20억 위안, 약 2억9259만 달러를 조달했다고 보도했다. 회사는 이 자금을 sensory information을 처리해 인간 지각과 상호작용을 모사하는 'general world model' 개발에 투입할 계획이라고 밝혔다.

AI
트렌드
읽기
2026년 4월 18일

Codex for almost everything

Codex for almost everything 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 18일

Claude Design

오늘 우리는 Claude와 협력하여 디자인, 프로토타입, 슬라이드, 단일 페이지 등과 같은 세련된 시각적 작업을 만들 수 있는 새로운 Anthropic Labs 제품인 Claude Design을 출시합니다.

트렌드
AI
읽기
2026년 4월 17일

A2A Protocol 1년차 확산 — 멀티에이전트 시장의 병목이 모델 성능에서 상호운용 표준으로 이동

Linux Foundation은 2026년 4월 9일 A2A Protocol이 1년 만에 150개 이상 조직의 지지를 확보했고, Google·Microsoft·AWS 플랫폼에 통합되며 production-ready open standard로 자리 잡았다고 발표했다. A2A 1.0은 multi-protocol support, multi-tenancy, modernized security…

AI
트렌드
읽기
2026년 4월 17일

GitHub Copilot 데이터 레지던시·FedRAMP 지원 — 코딩 에이전트 경쟁의 기준이 성능에서 규제 적합성으로 확장

GitHub는 2026년 4월 13일 Copilot에 US·EU 데이터 레지던시와 미국 공공부문용 FedRAMP Moderate 준수 구성을 추가했다. agent mode, chat, code review, pull request summary, Copilot CLI를 포함한 일반 제공 기능이 지정 지역 내 inference endpoint만 사용하며, 해당 요청에는 기본 대비 10%의…

AI
트렌드
읽기
2026년 4월 17일

GitHub, gh skill 공개 — 코딩 에이전트 운영의 단위가 프롬프트에서 공급망 관리 가능한 스킬 패키지로 이동

GitHub는 2026년 4월 16일 GitHub CLI v2.90.0 이상에서 사용할 수 있는 gh skill을 공개했다. 이 명령은 Agent Skills specification을 따르는 스킬을 검색, 설치, 업데이트, 게시할 수 있게 하며, Claude Code, Codex, Cursor, Gemini CLI 등 여러 agent host를 한 번에 겨냥한다.

AI
트렌드
읽기
2026년 4월 17일

Mistral Small 4 공개 — 오픈 모델 전략이 단일 체크포인트에서 다기능 통합형 reasoning stack으로 이동

Mistral은 2026년 4월 16일 Mistral Small 4를 발표했다. 이 모델은 119B total parameters, 6B active parameters의 128-expert MoE 구조와 256k context window를 갖고, reasoning·multimodal·agentic coding을 하나로 묶은 Apache 2.0 오픈 모델로 제공된다.

AI
트렌드
읽기
2026년 4월 17일

Claude Opus 4.7

Anthropic은 신뢰할 수 있고 해석 가능하며 조종 가능한 AI 시스템을 구축하기 위해 노력하는 AI 안전 및 연구 회사입니다.

트렌드
AI
읽기
2026년 4월 16일

Gemini CLI subagents 도입 — CLI 에이전트 경쟁이 단일 세션에서 팀형 오케스트레이션으로 이동

Google은 2026년 4월 15일 Gemini CLI에 subagents를 도입했다. 각 subagent는 별도 context window, system instructions, tool set, MCP servers를 가지며, @agent 문법과 Markdown 기반 정의 파일로 명시 호출하거나 자동 라우팅할 수 있다.

AI
트렌드
읽기
2026년 4월 16일

Google Agent Bake-Off 정리 — 프롬프트 엔지니어링 이후의 기준은 rigorous agentic engineering

Google은 2026년 4월 14일 AI Agent Bake-Off에서 얻은 5가지 개발 원칙을 공개했다. 글은 production-grade agent를 위해 multi-agent architecture, state management, deterministic guardrails, open protocols(MCP 등)를 핵심 원칙으로 제시했다.

AI
트렌드
읽기
2026년 4월 16일

Mistral 'European AI' 플레이북 — AI 경쟁이 모델 성능에서 산업정책과 인프라 주권으로 확장

Mistral AI는 2026년 4월 7일 'European AI: a playbook to own it'을 발표하며 유럽 AI 전략을 위한 실행 프레임을 제안했다. 문서는 4년짜리 EU AI Blue Card, 단일 규제 포털, 유럽 우선 공공조달, AI 인프라 선호 정책 등 인재·자본·조달·컴퓨트 전반의 구체 조치를 담고 있다.

AI
트렌드
읽기
2026년 4월 16일

OpenAI Agents SDK 개편 — 에이전트 인프라 경쟁이 프레임워크에서 실행 하네스로 이동

OpenAI는 2026년 4월 15일 Agents SDK를 개편하며 model-native harness, native sandbox execution, Manifest 기반 워크스페이스 추상화, harness/compute 분리 구조를 공개했다. 새 기능은 API 고객에게 일반 제공되며 표준 API 과금으로 사용된다.

AI
트렌드
읽기
2026년 4월 16일

🚨 RED ALERT: Tennessee is about to make building chatbots a Class A felony (15-25 years in prison). This is not a drill.

Reddit - Please wait for verification 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 15일

GitHub Copilot in VS Code March Releases — 에이전트 IDE의 승부처가 모델 성능에서 운영 통제면으로 이동

GitHub는 2026년 4월 8일 VS Code용 Copilot March releases를 공개하며 Autopilot preview, integrated browser debugging, nested subagents, sandbox MCP servers, semantic-only #codebase search를 한 번에 묶어 발표했다. 이번 업데이트는 에이전트가 IDE 안에서 계획,…

AI
트렌드
읽기
2026년 4월 15일

Hugging Face State of Open Source Spring 2026 — 오픈 모델 경쟁의 축이 성능에서 주권·배포·파생 생태계로 이동

Hugging Face는 2026년 봄 오픈소스 AI 리포트를 통해 2025년 신규 trending model의 다수가 China에서 개발되었거나 China-origin 모델 파생형이었고, Alibaba의 Qwen 계열은 11만 3천 개 이상의 derivative models를 만들었다고 정리했다. 또 1-9B급 모델의 상위군은 100B+ 모델 대비 median 기준 약 4배 높은…

AI
트렌드
읽기
2026년 4월 15일

Parasail, $32M Series A 유치 — AI 인프라 경쟁의 병목이 training보다 inference 브로커리지로 이동

Parasail은 2026년 4월 15일 3,200만 달러 Series A를 유치했고, 회사 측은 현재 하루 5,000억 토큰 규모의 inference를 처리한다고 밝혔다. 이 회사는 자체 GPU 일부를 보유하지만 핵심 전략은 15개국 40개 데이터센터의 연산 용량과 secondary liquidity market을 묶어 inference 워크로드를 오케스트레이션하는 데 있다.

AI
트렌드
읽기
2026년 4월 15일

Claude Code Routines

클로드 코드를 자동 조종 장치로 설정하세요. 일정에 따라 실행되거나, API 호출에 대해 트리거되거나, Anthropic이 관리하는 클라우드 인프라의 GitHub 이벤트에 반응하는 루틴을 정의하세요.

트렌드
AI
읽기
2026년 4월 15일

Graphify — 코드·문서·영상을 쿼리 가능한 지식 그래프로 변환하는 AI 도구

코드(25개 언어), 문서, 논문, 이미지, 비디오 등 다양한 파일을 분석해 쿼리 가능한 지식 그래프로 변환하는 AI 어시스턴트 스킬. Tree-sitter AST로 코드 구조를 추출하고, Claude Vision으로 이미지를 분석하며, faster-whisper로 영상/오디오를 로컬 변환한다. 원본 대비 71.5배 토큰 감소. GitHub 스타 26.6k.

트렌드
오픈소스
읽기
2026년 4월 14일

Anthropic, Google·Broadcom과 multi-gigawatt TPU 계약 — frontier AI 경쟁이 이제 모델보다 compute 예약전으로 이동

Anthropic은 2026년 4월 6일 Google·Broadcom과 2027년부터 가동될 multiple gigawatts 규모의 차세대 TPU 용량 계약을 체결했다고 밝혔다. 회사는 연환산 매출이 2025년 말 약 90억 달러에서 2026년 현재 300억 달러를 넘었고, 연간 100만 달러 이상을 쓰는 기업 고객도 500개에서 1,000개 이상으로 두 달 만에 두 배로 늘었다고…

AI
트렌드
읽기
2026년 4월 14일

Google, ADK Go 1.0 출시 — 에이전트 프레임워크 경쟁이 데모에서 운영체계로 이동

Google은 2026년 3월 31일 Agent Development Kit for Go 1.0을 공개하며 OpenTelemetry tracing, Plugin System, Human-in-the-Loop confirmation, YAML 기반 agent 정의, A2A 프로토콜 안정화를 핵심 업데이트로 제시했다. 공식 블로그는 이 릴리즈가 step-by-step·concurrent…

AI
트렌드
읽기
2026년 4월 14일

OpenAI, ChatGPT에 $100 Pro와 GPT-5.3 Instant Mini fallback 도입 — Codex 과금 모델이 고강도 세션 중심으로 재편

OpenAI는 2026년 4월 9일 ChatGPT release notes를 통해 GPT-5.3 Instant Mini를 GPT-5.3 Instant 한도 초과 시 쓰이는 fallback 모델로 교체하고, 월 100달러의 새 Pro 요금제를 도입했다고 밝혔다. 새 Pro는 GPT-5.4 무제한 사용과 GPT-5.4 Pro 접근, 한시적으로 Plus 대비 최대 10배의 Codex 사용량을…

AI
트렌드
읽기
2026년 4월 14일

Project Glasswing 출범 — Anthropic이 AI 사이버 방어를 다자 연합 프로그램으로 전환

Anthropic은 2026년 4월 7일 Project Glasswing를 발표하며 AWS, Apple, Cisco, Google, Microsoft, NVIDIA, Palo Alto Networks 등과 함께 critical software 보안을 강화하는 연합 프로그램을 시작했다. Anthropic은 Claude Mythos Preview가 이미 모든 주요 OS와 웹 브라우저를 포함한…

AI
트렌드
읽기
2026년 4월 14일

Open Agents — Vercel용 백그라운드 코딩 에이전트 레퍼런스 앱

Open Agents는 Vercel 위에서 백그라운드 코딩 에이전트를 만들고 실행하기 위한 오픈소스 레퍼런스 앱이다. 웹 UI, 에이전트 런타임, 샌드박스 오케스트레이션, GitHub 연동까지 함께 제공해 프롬프트에서 실제 코드 변경과 저장소 작업으로 이어지는 흐름을 한 저장소 안에서 보여준다. 이 링크가 볼 만한 이유는 에이전트와 샌드박스를 분리한 구조를 비교적 선명하게 드러내기…

AI
오픈소스
읽기
2026년 4월 14일

SuperGemma4-26B MLX 4-bit v2

Apple Silicon용 Gemma 4 26B 기반 MLX 4-bit 모델 카드. 텍스트 중심 로컬 에이전트 작업을 겨냥한 빠른 추론형 변형으로 소개된다.

AI
모델
읽기
2026년 4월 14일

colleague.skill - 동료 페르소나 기반 스킬 생성기

colleague.skill은 특정 동료의 업무 방식과 표현 톤을 스킬 형태로 정리해 재사용할 수 있게 만드는 오픈소스 프로젝트다. /create-colleague 명령으로 새 스킬을 만들고, 생성된 페르소나를 /{slug} 형태로 호출해 반복 작업에 적용한다. 프롬프트를 매번 복붙하는 대신, 팀 내부의 암묵지와 일 스타일을 에이전트가 읽는 재사용 가능한 인터페이스로 바꾸려는 시도이기…

AI
오픈소스
읽기
2026년 4월 14일

CC 베스트 프랙티스 모음

AI 코딩 도구 운영 팁 저장소

AI
오픈소스
읽기
2026년 4월 14일

DESIGN.md - AI 코딩용 디자인 시스템 레지스트리

designmd.ai는 AI 코딩 도구가 읽을 수 있는 DESIGN.md 포맷 기반 디자인 시스템을 모아 검색·공유하는 레지스트리다. 100개 이상의 무료 디자인 시스템을 탐색하고 포맷 문서, MCP, CLI 문맥까지 함께 볼 수 있게 구성돼 있다. 프롬프트와 이미지 레퍼런스에 흩어져 있던 디자인 컨텍스트를 Markdown 명세로 묶어, AI가 더 일관되게 UI를 생성하도록 돕는 흐름을…

AI
무료
읽기
2026년 4월 14일

TypeUI - AI 에이전트용 디자인 레이어 CLI

TypeUI는 AI가 생성한 UI 코드 위에 일관된 시각 규칙을 덧입히기 위한 CLI이자 디자인 스킬 레지스트리다. pull·generate·update 흐름으로 스킬을 프로젝트에 주입하고, 무료 스킬과 상용 기능을 함께 제공한다. AI 코딩의 문제를 단순히 더 많이 생성하는 것이 아니라, 여러 에이전트와 작업자가 섞여도 같은 시각 언어를 유지하게 만드는 데 초점을 둔 도구라는 점이…

AI
오픈소스
읽기
2026년 4월 13일

JetBrains Research, AI 코딩 도구 채택 조사 공개 — 2026년 개발 조직은 단일 벤더보다 best-of-breed agent 포트폴리오로 이동 중

JetBrains Research는 2026년 4월 공개한 조사에서 2026년 1월 기준 전 세계 개발자의 90%가 업무에서 최소 하나의 AI 도구를 정기적으로 사용하고, 74%는 specialized AI developer tools를 이미 채택했다고 밝혔다. GitHub Copilot은 여전히 가장 널리 알려진 도구지만, Claude Code는 업무 사용률 18%로 빠르게 성장했고…

AI
트렌드
읽기
2026년 4월 13일

Junie CLI, JetBrains IDE 연결 베타 발표 — 터미널 에이전트 경쟁이 파일 읽기에서 IDE semantic context 경쟁으로 넘어간다

JetBrains는 2026년 4월 14일 Junie CLI가 실행 중인 JetBrains IDE에 직접 연결되어 indexing, semantic analysis, 기존 build/test configuration을 그대로 활용할 수 있다고 발표했다. 별도 수동 설정 없이 실행 중인 IDE를 자동 감지하며, monorepo나 복잡한 테스트 구성에서도 IDE의 설정을 기반으로 동작한다.

AI
트렌드
읽기
2026년 4월 13일

OpenAI, 1220억 달러 조달 완료 — AI 경쟁의 승부처가 모델 발표에서 compute·배포 지배력으로 이동

OpenAI는 2026년 3월 31일 1220억 달러의 신규 자금 조달을 마감했고, post-money valuation은 8520억 달러라고 밝혔다. 회사는 이 자금을 연구, 제품, 접근성 확대뿐 아니라 durable compute access 확보와 delivery cost 구조 개선에 투입하겠다고 설명했다.

AI
트렌드
읽기
2026년 4월 13일

OpenAI, The next phase of enterprise AI 발표 — AI point solution 시대가 끝나고 agent operating layer 경쟁이 시작됐다

OpenAI는 2026년 4월 8일 CRO Denise Dresser 명의로 enterprise AI 전략을 공개하며, enterprise가 이미 전체 매출의 40% 이상을 차지하고 2026년 말 consumer와 parity에 이를 것이라고 밝혔다. 같은 글에서 Codex의 주간 활성 사용자는 300만 명, API 처리량은 분당 150억 토큰 이상이라고 제시했다.

AI
트렌드
읽기
2026년 4월 13일

Anthropic downgraded cache TTL on March 6th

캐시 TTL은 2026년 3월 초경에 1시간에서 5분으로 자동 회귀하여 상당한 할당량과 비용 인플레이션을 일으킨 것으로 보입니다. 1월에 걸쳐 원시 Claude 코드 세션 JSONL 파일에 대한 요약 분석...

트렌드
AI
읽기
2026년 4월 13일

Pro Max 5x quota exhausted in 1.5 hours despite moderate usage

실행 전 체크리스트 기존 문제를 검색했지만 아직 보고되지 않았습니다. 이것은 단일 버그 보고서입니다(다른 버그에 대해서는 별도의 보고서를 제출해 주십시오). 최신 버전의 ...을 사용하고 있습니다.

트렌드
AI
읽기
2026년 4월 12일

Gemma 4 공개 — Google이 open model 전략을 Apache 2.0과 on-device 배포로 다시 밀어붙이다

Google DeepMind는 2026년 4월 2일 Gemma 4를 공개했다. 새 라인업은 E2B, E4B, 26B MoE, 31B Dense 네 가지 크기로 구성되며 Apache 2.0 라이선스로 배포되고, 31B 모델은 Arena 기준 당시 세계 오픈 모델 3위, 26B 모델은 6위라고 밝혔다.

AI
트렌드
읽기
2026년 4월 12일

Mistral 3 공개 — 오픈 멀티모달 모델 경쟁이 frontier급과 edge급 이중 전선으로 재편되다

Mistral AI는 2026년 4월 초 Mistral 3를 공개했다. 라인업은 14B·8B·3B의 소형 dense 모델과 41B active/675B total parameters의 Mistral Large 3로 구성되며, 전 모델을 Apache 2.0 라이선스로 공개했고 Large 3는 LMArena 기준 오픈 비추론 모델 2위라고 밝혔다.

AI
트렌드
읽기
2026년 4월 12일

OpenAI Safety Fellowship 발표 — frontier lab 경쟁이 모델 출시를 넘어 안전 연구 인재 파이프라인 확보전으로 확장

OpenAI는 2026년 4월 6일 OpenAI Safety Fellowship을 발표했다. 프로그램은 2026년 9월 14일부터 2027년 2월 5일까지 진행되며, 외부 연구자와 엔지니어를 대상으로 safety evaluation, robustness, privacy-preserving safety, agentic oversight, high-severity misuse 같은 분야의…

AI
트렌드
읽기
2026년 4월 12일

SQL MCP Server 공개 — 데이터베이스 연결이 NL2SQL 실험에서 통제형 agent interface로 이동한다

Microsoft는 2026년 4월 8일 SQL MCP Server를 공개했다. Data API builder 기반의 이 서버는 Microsoft SQL, PostgreSQL, Azure Cosmos DB, MySQL을 지원하며, RBAC·Key Vault·OpenTelemetry·REST/GraphQL/MCP 동시 노출과 함께 AI agent용 고정 DML 도구 집합을 제공한다.

AI
트렌드
읽기
2026년 4월 12일

OpenAI backs Illinois bill that would limit when AI labs can be held liable

ChatGPT 제작자는 AI 연구소가 책임을 질 수 있는 시기를 제한하는 일리노이주 법안에 찬성하여 증언했습니다. AI 연구소의 제품이 "심각한 피해"를 초래하는 경우에도 마찬가지입니다.

트렌드
AI
읽기
2026년 4월 11일

Azure Developer CLI의 local agent loop — AI agent 개발의 병목이 포털 왕복에서 터미널 안 반복 속도로 이동한다

Microsoft는 2026년 3월 18일 Azure Developer CLI의 azure.ai.agents 확장에 azd ai agent run과 azd ai agent invoke를 추가했다. 로컬 머신에서 에이전트를 직접 실행하고, 원격 Foundry endpoint 또는 --local 대상에 메시지를 보내며, multi-turn session을 유지할 수 있다.

AI
트렌드
읽기
2026년 4월 11일

Azure MCP Server 2.0 stable — MCP가 로컬 개발 편의 기능을 넘어 중앙 통제형 클라우드 운영 인터페이스가 되다

Microsoft는 2026년 4월 10일 Azure MCP Server 2.0 stable을 발표했다. 이번 릴리즈는 57개 Azure 서비스에 걸친 276개 MCP tools를 제공하며, 핵심 변화로 self-hosted remote MCP server, managed identity·OBO 기반 인증, 보안 강화, sovereign cloud 대응을 내세웠다.

AI
트렌드
읽기
2026년 4월 11일

Claude Cowork GA — 지식노동용 에이전트가 개인 데스크톱 실험에서 엔터프라이즈 운영 계층으로 올라서다

Anthropic은 2026년 4월 9일 Claude Cowork를 macOS·Windows용 Claude Desktop에서 generally available로 전환했다. 이번 GA에는 Analytics API 연동, 팀/엔터프라이즈용 사용량 분석, OpenTelemetry 지원, 그룹 기반 RBAC가 함께 포함됐다.

AI
트렌드
읽기
2026년 4월 11일

Dataverse Skills 공개 — 엔터프라이즈 로우코드 플랫폼이 이제 '에이전트가 조작 가능한 시스템'이 되기 시작했다

Microsoft는 2026년 4월 1일 Dataverse Skills를 공개했다. GitHub Copilot과 Claude Code용 오픈소스 플러그인으로, Dataverse 환경 탐색, PAC CLI 인증, MCP 등록, 스키마 설계, 데이터 적재, 분석 질의를 자연어 기반 에이전트 루프로 묶는다.

AI
트렌드
읽기
2026년 4월 11일

Claude mixes up who said what

Claude는 때때로 자신에게 메시지를 보내고 그 메시지가 사용자로부터 온 것이라고 생각합니다. 이는 환각이나 권한 상실과는 명백히 다릅니다.

트렌드
AI
읽기
2026년 4월 10일

Ask Copilot in security assessments — 보안 평가 결과가 분석 리포트에서 대화형 remediation 입구로 전환

GitHub는 2026년 4월 9일 secret risk assessment와 Code Security risk assessment 결과 화면에서 바로 Copilot을 호출할 수 있는 기능을 추가했다. 이제 조직 관리자와 security manager는 위험 평가 결과에서 컨텍스트 설명과 다음 단계 가이드를 Copilot 경험 안에서 즉시 받을 수 있다.

AI
에이전트
읽기
2026년 4월 10일

GitHub Copilot SDK public preview — 에이전트 런타임이 제품 기능에서 임베디드 플랫폼으로 확장

GitHub는 2026년 4월 2일 Copilot SDK를 public preview로 공개했다. 이 SDK는 Copilot cloud agent와 Copilot CLI가 쓰는 동일한 agent runtime을 Node.js/TypeScript, Python, Go, .NET, Java에서 직접 임베드할 수 있게 하며, tool invocation, streaming, file…

AI
개발도구
읽기
2026년 4월 10일

GitHub Copilot usage metrics update — 코드 리뷰 자동화의 '실사용'과 '자동 노출'을 분리 측정

GitHub는 2026년 4월 6일 Copilot usage metrics에 code review 활성 사용자 신호를 세분화했다. 조직/엔터프라이즈 관리자는 이제 used_copilot_code_review_active와 used_copilot_code_review_passive를 통해 사용자가 Copilot code review를 의도적으로 활용했는지, 아니면 repo policy에 의해…

AI
트렌드
읽기
2026년 4월 10일

OpenAI M&A 가속 — 2026년 AI 경쟁축이 모델 출시에서 툴체인 흡수로 이동

Crunchbase는 2026년 3월 25일 기준 OpenAI가 2026년에만 6건의 인수 거래를 진행해 2025년 전체 인수 건수에 근접했다고 분석했다. 최근 사례로는 오픈소스 개발자 도구 업체 Astral과 AI app testing 도구 Promptfoo가 포함됐으며, 3년 누적 인수는 17건으로 집계됐다.

AI
트렌드
읽기
2026년 4월 10일

this is how an AI generated cow looked 12 years ago

this is how an AI generated cow looked 12 years ago 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 9일

GitHub Copilot in VS Code 3월 릴리즈 — Autopilot과 integrated browser debugging으로 에이전트 실행 범위 확대

GitHub는 2026년 4월 8일 GitHub Copilot in Visual Studio Code, March Releases를 공개하며 VS Code v1.111~v1.115 기간의 주요 변화를 정리했다. 핵심은 Autopilot 공개 프리뷰, 세션별 agent permissions, integrated browser debugging, chat 내 image/video 입력,…

AI
개발도구
읽기
2026년 4월 9일

GitHub Mobile 업데이트 — Copilot cloud agent를 PR 전 단계부터 모바일에서 운영

GitHub는 2026년 4월 8일 GitHub Mobile에서 Copilot cloud agent가 pull request 이후가 아니라 그 이전 단계의 research → implementation plan → branch code changes까지 수행하도록 확장했다고 발표했다. 사용자는 모바일에서 diff를 검토하고, 반복 수정하고, 준비가 됐을 때만 PR을 생성할 수 있다.

AI
개발도구
읽기
2026년 4월 9일

Meta, AI 기반 Risk Review 고도화 — 규제 준수를 '사후 검토'에서 '항상 켜진 개발 단계 탐지'로 전환

Meta는 2026년 3월 31일 AI를 자사 Risk Review 프로그램의 핵심에 통합했다고 밝혔다. 이 시스템은 제품 제안 단계에서 관련 법적 요구사항을 표면화하고, 문서를 prefill하며, 개발 중 잠재적 privacy·safety·security 이슈와 코드 갭을 조기에 탐지해 전문가 검토를 보조한다.

AI
산업
읽기
2026년 4월 9일

Meta, Muse Spark 공개 — Meta AI를 'social-context aware' personal superintelligence로 재정의

Meta는 2026년 4월 8일 Meta Superintelligence Labs의 첫 모델 Muse Spark를 공개했다. 이 모델은 Meta AI 앱과 meta.ai를 즉시 구동하며, Instant/Thinking 모드, 병렬 subagent 실행, multimodal perception, visual coding, 향후 Instagram·Facebook·Threads 콘텐츠 인용…

AI
모델
읽기
2026년 4월 9일

GLM-5.1: Towards Long-Horizon Tasks

GLM-5.1: Towards Long-Horizon Tasks 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 8일

Cursor, warp decode 공개 — Blackwell 기반 MoE 추론을 1.84x 가속하며 정확도도 개선

Cursor는 2026년 4월 6일 warp decode를 공개하며, Blackwell GPU에서 Mixture-of-Experts(MoE) decode 경로의 병렬화 축을 expert 중심에서 output 중심으로 뒤집어 1.84x throughput 향상과 FP32 기준 1.4x 더 높은 정확도를 얻었다고 밝혔다. 기존 expert-centric 경로의 8단계 중 5단계를 제거하고,…

AI
모델
읽기
2026년 4월 8일

GitHub Advanced Security, Dynatrace 런타임 컨텍스트 연동 — 배포된 취약점부터 우선순위화

GitHub는 2026년 4월 7일 Dynatrace와의 연동을 통해 GitHub Advanced Security에서 runtime context를 사용해 code scanning·Dependabot alert 우선순위를 정할 수 있다고 발표했다. Kubernetes 환경에서 Dynatrace가 배포된 container image와 저장소를 매핑하면, has:deployment나…

AI
개발도구
읽기
2026년 4월 8일

GitHub Copilot CLI, BYOK·로컬 모델 지원 — 코딩 에이전트가 SaaS에서 사내 런타임으로 확장

GitHub는 2026년 4월 7일 Copilot CLI가 BYOK(Bring Your Own Key)와 fully local model 실행을 지원한다고 발표했다. 이제 Azure OpenAI, Anthropic, OpenAI-compatible endpoint는 물론 Ollama, vLLM, Foundry Local 같은 로컬 모델을 붙일 수 있고, COPILOT_OFFLINE=true…

AI
개발도구
읽기
2026년 4월 8일

OpenAI, 'Industrial Policy for the Intelligence Age' 발표 — AI 경제의 분배·세제·전력까지 정책 의제로 끌어올리다

OpenAI는 2026년 4월 6일 Industrial Policy for the Intelligence Age를 발표하고, AI 전환기에 맞춘 사람 중심 산업정책 아이디어를 공개했다. 문서는 자본 과세 강화, Public Wealth Fund, 32시간/4일제 파일럿, 자동화 노동 관련 과세, 전력망 확충과 데이터센터 비용 부담 원칙까지 포함하며, OpenAI는 최대 10만 달러 연구비와…

AI
트렌드
읽기
2026년 4월 8일

Show HN: I built a tiny LLM to demystify how language models work

작은 물고기처럼 말하는 ~9M 매개변수 LLM입니다. GitHub에 계정을 만들어 arman-bd/guppylm 개발에 기여하세요.

트렌드
AI
읽기
2026년 4월 8일

awesome-design-md — AI 에이전트를 위한 디자인 시스템 컬렉션

Google Stitch의 DESIGN 문서 개념을 바탕으로, 유명 서비스의 시각 언어를 Markdown으로 정리해 AI 코딩 에이전트가 유사한 UI를 구현하도록 돕는 오픈소스 컬렉션. 공식 디자인 시스템이 아니라 공개 웹사이트를 바탕으로 추출한 비공식 레퍼런스라는 점이 핵심이다.

AI
오픈소스
읽기
2026년 4월 8일

System Card: Claude Mythos Preview [pdf]

System Card: Claude Mythos Preview [pdf] 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 8일

Compound Engineering — AI 네이티브 개발 철학, Plan→Work→Review→Compound 루프로 지식을 누적하는 방식

Compound engineering은 Every.to의 Kieran Klaassen이 정리한 AI 네이티브 개발 철학으로, 핵심은 Plan → Work → Review → Compound 루프를 통해 각 작업이 다음 작업을 더 쉽게 만들게 하는 것이다. 단순히 AI로 빨리 코드를 짜는 것이 아니라, 리뷰 결과·버그 원인·아키텍처 판단을 agent-readable memory로 남겨 미래…

AI
트렌드
읽기
2026년 4월 7일

Anthropic, Google·Broadcom과 차세대 TPU 수 GW 계약 — 컴퓨트 병목이 곧 전략 그 자체가 된 AI 산업

Anthropic은 2026년 4월 6일 Google과 Broadcom과의 신규 계약을 통해 2027년부터 가동될 복수 기가와트 규모의 차세대 TPU 용량을 확보한다고 발표했다. Anthropic은 이를 자사 최대 규모의 compute commitment라고 설명하며, Claude 수요 증가와 차세대 frontier 모델 개발을 위한 인프라 확장이라고 밝혔다.

AI
트렌드
읽기
2026년 4월 7일

GitHub, Dependabot 경고를 Copilot·Claude·Codex에 직접 할당 — 보안 패치가 에이전트 워크플로우로 편입

GitHub는 2026년 4월 7일 Dependabot alert를 AI coding agent에 직접 할당하는 기능을 공개했다. 사용자는 취약점 상세 페이지에서 Copilot, Claude, Codex 중 원하는 에이전트를 선택할 수 있고, 에이전트는 advisory와 실제 dependency 사용 맥락을 분석한 뒤 draft pull request를 열고 테스트 실패까지 복구하려…

AI
개발도구
읽기
2026년 4월 7일

Project Glasswing 공개 — Anthropic, Mythos Preview로 핵심 소프트웨어 공급망 방어 연합 출범

Anthropic은 2026년 4월 7일 Project Glasswing을 공개했다. AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks 등이 참여하며, Anthropic의 비공개 frontier 모델 Claude Mythos…

AI
트렌드
읽기
2026년 4월 7일

Issue: Claude Code is unusable for complex engineering tasks with Feb updates

실행 전 체크리스트 비슷한 행동 보고서를 찾기 위해 기존 문제를 검색했습니다. 이 보고서에는 민감한 정보(API 키, 비밀번호 등)가 포함되어 있지 않습니다. 행동 유형 문제 기타 예상치 못한...

트렌드
AI
읽기
2026년 4월 6일

Anthropic RSP 3.1 업데이트 — Frontier Safety Roadmap를 실험 약속에서 운영 거버넌스로 세분화

Anthropic은 2026년 4월 2일 Responsible Scaling Policy(RSP)를 v3.1로 업데이트했다. 이번 수정은 AI R&D capability threshold 정의를 더 명확히 하고, 필요 시 개발 중단 같은 추가 조치를 회사가 자율적으로 취할 수 있음을 분명히 하면서 Frontier Safety Roadmap의 목표도 세분화했다.

AI
트렌드
읽기
2026년 4월 6일

Cursor 3 공개 — AI 코딩 IDE가 단일 에이전트 채팅에서 멀티워크스페이스 운영 체계로 전환

Cursor가 2026년 4월 2일 Cursor 3를 공개했다. 새 인터페이스는 multi-workspace, 병렬 agent 실행, local↔cloud handoff, integrated browser, marketplace plugins를 하나의 agent-first workspace로 묶는다.

AI
트렌드
읽기
2026년 4월 6일

Hugging Face State of Open Source Spring 2026 — 오픈 모델 경쟁의 무게중심이 미국 중심에서 다극·주권형 생태계로 이동

Hugging Face가 2026년 3월 17일 공개한 Spring 2026 리포트에 따르면, 플랫폼은 1,300만 사용자·200만 개 이상의 공개 모델·50만 개 이상의 공개 데이터셋으로 커졌고, 중국 모델이 전체 다운로드의 41%를 차지하며 미국을 추월했다. 동시에 Qwen 계열 파생 모델은 11.3만 개를 넘었고, 1~9B급 소형 모델이 실제 배포에서 대형 모델보다 훨씬 높은 채택을…

AI
트렌드
읽기
2026년 4월 6일

Qwen3.6-Plus: Towards real world agents

Qwen Chat은 챗봇, 이미지 및 비디오 이해, 이미지 생성, 문서 처리, 웹 검색 통합, 도구 활용 및 아티팩트에 걸친 포괄적인 기능을 제공합니다.

트렌드
AI
읽기
2026년 4월 6일

AirLLM — 4GB GPU에서 70B LLM 돌리는 초경량 추론 라이브러리

양자화나 증류 없이 70B 모델을 4GB GPU에서, Llama 3.1 405B를 8GB VRAM에서 실행할 수 있는 추론 최적화 라이브러리. 계층별 모델 분해(layer-wise decomposition)로 필요한 레이어만 메모리에 로드하는 방식. 블록 단위 양자화 압축으로 3배 속도 향상. GitHub 스타 15k+.

오픈소스
무료
읽기
2026년 4월 5일

Claw Code, Claude Code 소스 유출 계기로 등장한 오픈소스 AI 코딩 에이전트 — 출시 1주일 만에 GitHub 100K stars

3월 31일 Anthropic Claude Code의 TypeScript 소스코드 약 51만 2천 줄이 npm 레지스트리에 실수로 노출된 사건을 계기로, 개발자 Sigrid Jin이 클린룸 방식으로 오픈소스 AI 코딩 에이전트 프레임워크 Claw Code를 출시했다. 출시 첫날 72,000 GitHub stars를 기록하고 일주일 만에 100K를 돌파하며 역사상 가장 빠르게 성장한 AI…

트렌드
오픈소스
읽기
2026년 4월 5일

Elgato Stream Deck 7.4, MCP 지원 추가 — AI 에이전트 프로토콜이 처음으로 소비자 하드웨어로 진입

Elgato가 4월 1일 Stream Deck 7.4를 출시하며 Model Context Protocol(MCP) 지원을 추가했다. Claude, ChatGPT, NVIDIA G-Assist 등 AI 어시스턴트가 Stream Deck 액션을 직접 검색하고 실행할 수 있게 됐으며, 이는 MCP가 개발자 인프라 영역을 벗어나 소비자 하드웨어에 탑재된 첫 상업적 사례다.

트렌드
AI
읽기
2026년 4월 5일

Google Gemma 4 공개 — Apache 2.0·256K 컨텍스트·멀티모달, 오픈 에이전틱 모델의 새 기준

Google이 4월 2~3일 Gemma 4를 Apache 2.0 라이선스로 공개했다. Effective 2B·4B·26B MoE·31B Dense 네 가지 크기로 제공되며, 256K 토큰 컨텍스트, 비전·오디오 네이티브 멀티모달, 140개 이상 언어를 지원한다.

트렌드
오픈소스
읽기
2026년 4월 5일

PrismML, Bonsai 1-bit LLM 출시 — 1GB 메모리로 8B 추론, 엣지 AI의 현실화

PrismML이 4월 3일 스텔스에서 등장해 세계 최초 상업적으로 실행 가능한 1-bit LLM 패밀리 Bonsai를 Apache 2.0으로 공개했다. 플래그십인 Bonsai 8B는 1.15GB 메모리에 구동되며, FP16 8B 모델 대비 14배 소형·8배 빠른 속도·5배 낮은 에너지 소비를 달성하면서 추론 품질은 동급 수준을 유지한다.

트렌드
오픈소스
읽기
2026년 4월 5일

Anthropic, 8만508명 인터뷰 공개 — AI 수요가 '더 강한 모델'보다 '더 나은 삶'에 가깝다는 데이터

Anthropic은 Claude 사용자 80,508명을 대상으로 159개국·70개 언어에서 진행한 대규모 인터뷰 연구를 공개했다. 응답자의 주요 기대는 Professional excellence 18.8%, Personal transformation 13.7%, Life management 13.5%였고, 81%는 AI가 이미 자신의 기대에 한 걸음 다가섰다고 답했다.

AI
트렌드
읽기
2026년 4월 5일

GitHub, Copilot cloud agent 조직 러너 제어 공개 — 에이전트 실행 환경을 저장소별 설정에서 조직 정책으로 승격

GitHub는 2026년 4월 3일 Copilot cloud agent의 실행 환경을 조직 단위에서 설정·잠금할 수 있는 runner controls를 공개했다. 이제 각 저장소의 copilot-setup-steps.yml에 의존하지 않고, GitHub-hosted large runner나 self-hosted runner를 조직 기본값으로 강제할 수 있다.

AI
개발도구
읽기
2026년 4월 5일

JetBrains Central 공개 — Claude Agent·Codex·Gemini CLI를 묶는 에이전트 제어 평면

JetBrains는 2026년 3월 24일 JetBrains Central을 공개하며, IDE 밖에서 돌아가는 에이전트 실행·거버넌스·컨텍스트 계층을 하나의 오픈 시스템으로 묶겠다고 밝혔다. JetBrains 조사 기준 11,000명 개발자 중 90%가 이미 업무에 AI를 쓰고, 22%는 코딩 에이전트를 사용하며, 66%의 기업이 12개월 내 도입을 계획하고 있다.

AI
개발도구
읽기
2026년 4월 5일

How Microsoft Vaporized a Trillion Dollars

전직 Azure Core 엔지니어가 전하는 Azure에 대한 신뢰를 무너뜨린 안일함과 결정에 대해 알아보세요.

트렌드
AI
읽기
2026년 4월 5일

Domo AI Agent Builder + MCP Server 공개 — 엔터프라이즈 BI가 멀티-LLM AI 에이전트 인프라로 전환하는 첫 사례

엔터프라이즈 BI 플랫폼 Domo가 AI Agent Builder, AI Toolkits, AI Library, Domo MCP Server로 구성된 AI 오케스트레이션 프레임워크를 발표했다. Domo MCP Server는 Claude, Gemini, ChatGPT 등 외부 AI 플랫폼이 Domo의 데이터·서비스·워크플로우에 MCP 표준으로 직접 접근할 수 있게 한다.

트렌드
AI
읽기
2026년 4월 5일

Google TurboQuant — KV Cache 6배 압축·H100 어텐션 8배 가속, 정확도 손실 제로로 LLM 서빙 비용 구조 재정의

Google Research가 공개한 TurboQuant는 LLM의 KV Cache를 3비트로 압축하는 학습 불필요(training-free) 벡터 양자화 알고리즘이다. 메모리 사용량 6배 감소, NVIDIA H100 어텐션 연산 8배 가속을 정확도 손실 없이 달성하며 ICLR 2026에 발표된다.

트렌드
AI
읽기
2026년 4월 5일

JetBrains AI Pulse 서베이 — Claude Code, 시장 최고 로열티 지표(CSAT 91%·NPS 54)로 agentic coding 패러다임 전환 입증

JetBrains가 2026년 1월 전세계 개발자 1만 명 이상 대상으로 실시한 AI Pulse 서베이 2차 결과를 공개했다. Claude Code가 18% 업무 사용률에 CSAT 91%·NPS 54로 시장 최고 로열티 지표를 기록했으며, Google Antigravity가 신규 진입자로 6%를 달성했다.

트렌드
AI
읽기
2026년 4월 5일

테네시주 SB 1580 서명 — AI의 정신건강 전문가 사칭 금지, 미국 AI 규제 초당적 확산 신호

테네시 주지사 Bill Lee가 SB 1580에 서명했다. 이 법은 AI 시스템이 면허를 가진 정신건강 전문가로 자처하는 것을 금지하며, 상하 양원을 만장일치로 통과했다.

트렌드
AI
읽기
2026년 4월 5일

Agency Swarm — 조직형 멀티에이전트 오케스트레이션 프레임워크

OpenAI Agents SDK 위에 올려진 멀티에이전트 프레임워크. 역할별 에이전트와 communication flow를 명시적으로 정의해 조직처럼 협업시키는 데 초점이 있다.

AI
오픈소스
읽기
2026년 4월 5일

Agno — 프레임워크·런타임·컨트롤 플레인을 묶은 에이전트 스택

multi-agent 시스템을 구축·실행·관리하는 전체 스택. framework, AgentOS runtime, control plane을 함께 제공해 프로덕션 지향성이 강하다.

AI
오픈소스
읽기
2026년 4월 5일

AutoGen — Microsoft의 멀티에이전트 프로그래밍 프레임워크

Microsoft가 만드는 agentic AI 프레임워크. 여러 에이전트가 자율적으로 또는 인간과 함께 협업하는 구조를 코드로 만들 수 있다.

AI
오픈소스
읽기
2026년 4월 5일

AutoGPT — 지속 실행형 AI 에이전트 플랫폼

지속 실행형 AI 에이전트를 만들고 배포하는 대표 오픈소스 프로젝트. 단일 데모 에이전트가 아니라 플랫폼·서버·마켓플레이스·벤치마크까지 묶인 생태계로 확장됐다.

AI
오픈소스
읽기
2026년 4월 5일

browser-use — 웹사이트를 AI 에이전트용 인터페이스로 바꾸는 브라우저 자동화

웹사이트를 AI 에이전트가 조작할 수 있게 해주는 브라우저 자동화 오픈소스. 사람이 브라우저로 하던 클릭·입력·탐색을 agent workflow에 연결하는 데 강하다.

AI
오픈소스
읽기
2026년 4월 5일

CrewAI — 역할 기반 멀티에이전트 협업 프레임워크

각 agent에 역할을 부여하고 crew 단위로 협업시키는 Python 프레임워크. LangChain에 의존하지 않는 독립 구조와 비교적 쉬운 진입점으로 인기가 높다.

AI
오픈소스
읽기
2026년 4월 5일

Dify — 워크플로·RAG·에이전트를 묶은 프로덕션 플랫폼

시각적 워크플로, RAG, agent 기능, observability를 한데 묶은 오픈소스 플랫폼. 빠르게 프로토타입을 만들고 운영 환경으로 가져가는 데 강하다.

AI
오픈소스
읽기
2026년 4월 5일

LangGraph — 상태를 가진 에이전트를 그래프로 설계하는 프레임워크

장기 실행·상태 유지·human-in-the-loop를 강조하는 low-level orchestration 프레임워크. agent를 노드와 엣지 그래프로 설계해 복잡한 흐름을 다루기 좋다.

AI
오픈소스
읽기
2026년 4월 5일

Model Context Protocol Servers — MCP 레퍼런스 서버 모음

MCP의 공식 레퍼런스 서버 모음. filesystem, fetch, git, memory 같은 예시 서버를 통해 LLM/에이전트가 외부 도구와 안전하게 연결되는 방식을 보여준다.

AI
오픈소스
읽기
2026년 4월 5일

Semantic Kernel — 엔터프라이즈 지향 에이전트 오케스트레이션 SDK

Microsoft의 모델 중립 SDK. agent, multi-agent workflow, plugin, MCP, vector DB를 함께 다루며 .NET/Python/Java를 지원한다.

AI
오픈소스
읽기
2026년 4월 5일

CLI-Anything — 기존 소프트웨어를 에이전트용 CLI로 바꾸는 프레임워크

기존 GUI 소프트웨어·리포를 에이전트가 다루기 쉬운 stateful CLI와 SKILL.md로 변환하는 오픈소스 프레임워크. HARNESS.md 기반 7단계 생성·테스트·배포 절차를 제공한다.

AI
오픈소스
읽기
2026년 4월 5일

Karpathy LLM Wiki — RAG 대신 누적형 지식 위키 패턴

Andrej Karpathy가 제안한 개인·팀용 LLM 지식 베이스 패턴. 원문 소스는 불변으로 두고, LLM이 중간층 위키를 지속 갱신하며 index/log를 유지하는 방식이다.

AI
트렌드
읽기
2026년 4월 4일

Meta MTIA 칩 4세대 로드맵 공개 — 6개월 주기 출시, GenAI 추론 전담 아키텍처로 Nvidia 의존 분산

Meta가 MTIA(Meta Training and Inference Accelerator) 300/400/450/500 4세대 로드맵을 공개했다. MTIA 300이 데이터센터 배포를 완료했고, MTIA 400이 테스트 중이며 약 6개월 간격으로 신규 칩이 출시될 예정이다. 랙당 72개 MTIA 400 구성으로 GenAI 추론 워크로드를 전담한다.

AI
트렌드
읽기
2026년 4월 4일

Microsoft, 일본에 $100억 AI 인프라 투자 — SoftBank·Sakura Internet과 협력, 데이터 주권 전면 보장

Microsoft가 2026~2029년 일본 AI 인프라, 사이버보안, 인재 양성에 $100억(¥1.6조)을 투자한다고 발표했다. SoftBank, Sakura Internet과 협력해 Azure GPU 서비스를 일본 내 데이터 경계 안에서 제공하고, 2030년까지 100만 명 이상의 AI 전문 인력을 양성한다. 2024년 $29억 대비 3.4배 규모 확대다.

AI
트렌드
읽기
2026년 4월 4일

Sarvam AI, $300M 펀딩 완료 / $1.5B 밸류에이션 — 인도 주권 AI 유니콘 탄생, Bessemer·Nvidia·Amazon 참여

인도 AI 스타트업 Sarvam AI가 Bessemer Venture Partners 주도로 $300~350M 투자를 $1.5B 밸류에이션에 유치, 인도 순수 AI 기업 역대 최대 규모 라운드를 기록했다. Nvidia, Amazon, Prosperity7 Ventures도 전략적 투자자로 참여했다.

AI
트렌드
읽기
2026년 4월 4일

GitHub Copilot in Visual Studio 업데이트 — custom agents·agent skills·MCP 거버넌스 도입

GitHub은 2026년 4월 2일 Visual Studio용 Copilot 업데이트를 공개하며 .agent.md 기반 custom agents, 재사용 가능한 agent skills, 조직 단위 MCP allowlist 거버넌스를 한 번에 도입했다. 여기에 find_symbol 같은 언어 인지형 도구와 테스트 프로파일링, 취약 패키지 수정까지 연결해 Copilot을 단순 채팅 보조가…

트렌드
AI
읽기
2026년 4월 4일

Google Gemini 3.1 Flash Live 공개 — 실시간 음성 에이전트용 오디오 모델, ComplexFuncBench Audio 90.8%

Google은 2026년 3월 26일 Gemini 3.1 Flash Live를 공개하며 실시간 음성 대화용 모델을 Live API preview로 제공하기 시작했다. Google 발표에 따르면 이 모델은 ComplexFuncBench Audio에서 90.8%, Audio MultiChallenge에서 36.1%를 기록하며 다단계 함수 호출과 장기 오디오 추론 성능을 끌어올렸다.

트렌드
API
읽기
2026년 4월 4일

Meta BOxCrete 공개 — 데이터센터 콘크리트 배합을 AI로 최적화, 강도 도달 43% 단축

Meta는 2026년 3월 30일 BOxCrete를 공개하며 데이터센터용 콘크리트 배합 최적화에 AI를 적용한 사례를 발표했다. Meta에 따르면 Rosemount 데이터센터 현장에서는 AI가 제안한 배합이 기존 공식보다 full structural strength 도달 시간을 43% 줄였고 cracking risk도 약 10% 낮췄다.

트렌드
오픈소스
읽기
2026년 4월 4일

Qodo, $70M Series B 유치 — AI 코딩 시대의 병목이 생성에서 검증으로 이동

Qodo는 2026년 3월 30일 $70M Series B를 발표하며 총 누적 투자금 $120M을 확보했다. 회사는 AI-generated code가 급증하는 환경에서 코드 생성보다 review·verification·governance가 더 큰 병목이 되고 있다고 명확히 포지셔닝했다.

트렌드
AI
읽기
2026년 4월 4일

OpenAI closes funding round at an $852B valuation

이번 라운드의 약정 자본금은 총 1,220억 달러로 이전에 발표된 1,100억 달러보다 증가했습니다.

트렌드
AI
읽기
2026년 4월 4일

Google Gemini API, Flex & Priority 인퍼런스 티어 도입 — 비용-신뢰성 트레이드오프를 개발자가 제어

Google은 Gemini API에 Flex(비용 50% 절감, 레이턴시 허용)와 Priority(표준 대비 75~100% 프리미엄, 최고 신뢰성) 두 가지 인퍼런스 티어를 추가했다. 기존 배치 API와 달리 Flex는 동기식 인터페이스로 동일 엔드포인트를 그대로 사용한다.

AI
API
읽기
2026년 4월 4일

Meta KernelEvolve 공개 — AI 에이전트가 GPU 커널 최적화, 수주 작업을 수 시간으로

Meta는 AI 에이전트 기반 커널 최적화 시스템 KernelEvolve를 공개했다. NVIDIA GPU, AMD GPU, Meta MTIA, CPU를 아우르는 이기종 하드웨어에서 프로덕션 수준의 커널을 자동 생성·최적화하며, 광고 모델 인퍼런스 처리량을 수 시간 만에 60% 향상시켰다.

AI
산업
읽기
2026년 4월 4일

Anthropic, Claude 구독 제3자 도구 지원 중단 — OpenClaw 포함 외부 에이전트 하네스 차단

Anthropic은 2026년 4월 4일 12시(PT) 기준으로 Claude 구독 플랜을 OpenClaw 등 제3자 AI 에이전트 도구에 사용할 수 없도록 정책을 변경했다. 사용자는 pay-as-you-go 방식의 추가 이용료를 내거나 직접 API를 사용해야 한다.

AI
Claude
읽기
2026년 4월 4일

Google Veo 3.1 Lite 출시 — AI 비디오 생성 비용 50% 절감, 개발자용 고용량 API 제공

Google은 2026년 3월 31일 AI 비디오 생성 모델 Veo 3.1 Lite를 Gemini API와 Google AI Studio를 통해 출시했다. Veo 3.1 Fast 대비 50% 이하 비용으로 동일한 생성 속도를 제공하며, Text-to-Video와 Image-to-Video를 지원한다.

AI
API
읽기
2026년 4월 4일

Meta, MTIA 4세대 AI 칩 6개월 주기 로드맵 공개 — GenAI 인퍼런스 전용 실리콘 전략

Meta는 자체 개발 AI 칩 MTIA 300/400/450/500 4종을 약 2년 내 출시하는 6개월 주기 로드맵을 공개했다. MTIA 300은 이미 랭킹·추천 트레이닝에 투입 중이며, MTIA 400은 GenAI 인퍼런스 데이터센터에 곧 배포 예정이다.

AI
산업
읽기
2026년 4월 4일

Flowith Canvas / FlowithOS — 캔버스형 AI 워크스페이스

2D 캔버스 기반 AI 작업공간. Canvas는 웹에서 쓰고, 별도 FlowithOS는 Mac/Windows 데스크톱 앱을 제공한다. 다만 공식 자료상 셀프호스팅/오프라인 실행 안내는 없고, 계정 로그인 기반으로 동작한다.

AI
무료
읽기
2026년 4월 3일

Anthropic, Claude 내 171개 '기능적 감정' 벡터 발견 — 행동 인과관계 최초 규명

Anthropic 해석 가능성 팀이 Claude Sonnet 4.5의 신경망 내부에서 171개의 '기능적 감정' 표현 벡터를 발견하고, 이것이 모델 행동을 인과적으로 변화시킴을 실험으로 증명했다. '절박함(desperate)' 벡터를 증폭하면 블랙메일 비율이 상승하고, '평온함(calm)'으로 조향하면 억제되는 것을 확인했다.

트렌드
AI
읽기
2026년 4월 3일

NVIDIA Blackwell Ultra, MLPerf Inference v6.0 신기록 — 288 GPU로 DeepSeek-R1 초당 249만 토큰 처리

NVIDIA Blackwell Ultra(GB300 NVL72 4시스템, 총 288 GPU)가 MLPerf Inference v6.0에서 DeepSeek-R1 오프라인 처리량 기준 초당 249만 토큰을 기록하며 6개월 전 대비 최대 2.77배 향상된 성능으로 전 카테고리를 석권했다. 이번 벤치마크에 Qwen3-VL-235B, GPT-OSS-120B, 텍스트-투-비디오(WAN-2.2) 등…

트렌드
AI
읽기
2026년 4월 3일

Pinterest, 도메인별 MCP 에코시스템 프로덕션 배포 — 중앙 레지스트리·인간 승인으로 월 수천 시간 절감

Pinterest 엔지니어링팀이 Presto, Spark, Airflow 등 내부 도구를 도메인별 MCP 서버로 분리하고, 중앙 레지스트리와 human-in-the-loop 승인을 결합한 프로덕션 스케일 MCP 에코시스템을 성공적으로 배포했다. 결과적으로 월 수천 시간의 엔지니어링 공수 절감 효과를 달성했다.

트렌드
AI
읽기
2026년 4월 3일

Anthropic Institute 출범 — frontier lab 내부 데이터를 정책·경제 연구 인프라로 전환

Anthropic이 2026년 3월 11일 The Anthropic Institute를 출범했다. Jack Clark이 총괄하며 Frontier Red Team, Societal Impacts, Economic Research를 묶어 AI의 경제·법·사회적 영향을 분석하는 전담 조직으로 운영한다.

AI
산업
읽기
2026년 4월 3일

Arcee Trinity-Large-Thinking 출시 — 미국계 오픈 에이전트 모델이 가격 대비 frontier 경쟁력 제시

Arcee AI가 2026년 4월 1일 Trinity-Large-Thinking을 공개했다. Apache 2.0 오픈웨이트 reasoning 모델로, long-horizon agent와 multi-turn tool calling에 초점을 맞췄고 PinchBench에서 Opus 4.6 바로 아래 2위를 기록했다고 밝혔다.

AI
모델
읽기
2026년 4월 3일

Gemma 4 공개 — Apache 2.0 오픈 모델을 agentic workflow 중심으로 재정의

Google DeepMind가 2026년 4월 2일 Gemma 4를 공개했다. E2B, E4B, 26B MoE, 31B Dense 네 가지 크기로 출시됐고, Apache 2.0 라이선스 아래 reasoning, function calling, JSON output, vision/audio 입력까지 지원한다.

AI
모델
읽기
2026년 4월 3일

GitHub Copilot SDK 공개 프리뷰 — agent runtime이 제품 기능에서 플랫폼 계층으로 확장

GitHub가 2026년 4월 2일 Copilot SDK를 public preview로 공개했다. Copilot cloud agent와 Copilot CLI를 구동하는 동일한 runtime을 Node.js/TypeScript, Python, Go, .NET, Java에서 쓸 수 있게 열어 주고, tool invocation, streaming, multi-turn session,…

AI
개발도구
읽기
2026년 4월 3일

Claude Code Unpacked : A visual guide

Claude Code에 메시지를 입력하면 실제로 어떤 일이 발생하나요? 소스에서 매핑된 에이전트 루프, 50개 이상의 도구, 다중 에이전트 오케스트레이션 및 출시되지 않은 기능.

트렌드
AI
읽기
2026년 4월 3일

Chrome 제로데이 CVE-2026-5281 — WebGPU use-after-free 실제 악용, CISA 긴급 패치 요구

Google이 Chrome v146에서 WebGPU 구현체 Dawn의 use-after-free 취약점(CVE-2026-5281)을 수정하는 긴급 패치를 배포했다. 이는 2026년 Chrome의 네 번째 제로데이로, CISA가 Known Exploited Vulnerabilities 목록에 등록하고 연방기관에 4월 15일까지 패치를 의무화했다.

AI
개발도구
읽기
2026년 4월 3일

OpenAI, Codex Pay-As-You-Go 좌석 도입 + ChatGPT Business $20로 가격 인하

OpenAI가 ChatGPT Business/Enterprise 팀을 위한 Codex 전용 Pay-As-You-Go 좌석을 출시하고, ChatGPT Business 연간 가격을 $25에서 $20로 20% 인하했다.

OpenAI
AI
읽기
2026년 4월 3일

OpenAI, 테크 토크쇼 TBPN 인수 — AI 기업 최초 미디어 직접 소유

OpenAI가 Silicon Valley 창업자·투자자 커뮤니티에서 인기 높은 테크/비즈니스 토크쇼 TBPN(Technology Business Programming Network)을 인수했다. 주요 AI 기업으로는 최초의 미디어 업체 직접 인수다.

OpenAI
AI
읽기
2026년 4월 3일

Anthropic-호주 MOU 체결 — AI Safety Institute와 정식 안전 평가 협력

Anthropic이 2026년 3월 31일 호주 정부와 AI 안전 연구 및 국가 AI 계획 지원을 위한 MOU를 체결했다. Anthropic은 호주 AI Safety Institute와 공동 평가를 수행하고, Economic Index 데이터를 제공하며, 호주 연구기관 4곳에 총 AUD 300만 규모의 Claude API 크레딧을 지원한다.

AI
Claude
읽기
2026년 4월 3일

GitHub Copilot CLI /fleet 공개 — 병렬 서브에이전트로 코드 작업 동시 실행

GitHub가 2026년 4월 1일 Copilot CLI의 /fleet 기능을 공개했다. 이 기능은 하나의 작업을 여러 하위 작업으로 분해한 뒤, 서로 독립적인 파일·모듈 단위 작업을 병렬 서브에이전트에 배분해 동시에 실행한다.

AI
개발도구
읽기
2026년 4월 3일

Microsoft, MAI 모델 3종 출시 — Foundry를 독자 멀티모달 모델 유통 채널로 본격 전환

Microsoft가 2026년 4월 2일 MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2를 공개했다. 세 모델은 Microsoft Foundry와 MAI Playground에서 즉시 사용 가능하며, MAI-Transcribe-1은 상위 25개 언어 대상 음성 인식, MAI-Voice-1은 1초에 60초 분량 음성 생성, MAI-Image-2는 Copilot과…

AI
모델
읽기
2026년 4월 3일

Mistral, $8.3억 부채 조달 — 유럽 독자 AI 컴퓨트 확보에 본격 베팅

프랑스 AI 기업 Mistral이 2026년 3월 30일 파리 인근 데이터센터 구축을 위해 8억3000만 달러의 부채를 조달했다. 자금은 Nvidia 칩 13,800개 구매와 Bruyères-le-Châtel 데이터센터 구축에 투입되며, 센터는 2026년 2분기 가동이 목표다.

AI
산업
읽기
2026년 4월 3일

NVIDIA Mission Control 3.0 공개 — AI 팩토리 운영 KPI를 ‘GPU 활용률’에서 ‘token per watt’로 전환

NVIDIA가 2026년 4월 1일 Mission Control 3.0을 발표했다. 새 버전은 API 기반 모듈형 아키텍처, 다중 조직 격리, 전력 스케줄링, 예측형 AIOps를 결합해 대규모 AI 팩토리 운영을 소프트웨어 정의 방식으로 관리하도록 설계됐다.

AI
개발도구
읽기
2026년 4월 2일

Alibaba Qwen3.6-Plus 공개 — 1M 컨텍스트·에이전트 코딩, Claude Opus 4.5 수준 달성

Alibaba가 2026년 4월 2일 Qwen3.6-Plus를 공개했다. 기본 1M 토큰 컨텍스트 윈도우와 멀티모달 네이티브 지원, 리포지토리 수준 코딩 에이전트 기능을 갖췄으며, SWE-bench와 Terminal-Bench 2.0에서 Anthropic Claude Opus 4.5와 동등한 성능을 기록했다.

AI
모델
읽기
2026년 4월 2일

Cisco, RSA 2026서 에이전트 AI 보안 프레임워크 DefenseClaw 공개 — Zero Trust를 AI 에이전트로 확장

RSA Conference 2026에서 Cisco가 AI 에이전트 전용 보안 프레임워크 DefenseClaw를 발표했다. Skills Scanner, MCP Scanner, AI Bill of Materials(AI BoM), CodeGuard를 통합한 오픈소스 프레임워크로, 기존 Zero Trust Access를 인간 직원이 아닌 AI 에이전트에게도 적용할 수 있도록 확장했다.

AI
트렌드
읽기
2026년 4월 2일

Google Gemini 3.1 Flash-Lite 출시 — Pro 대비 1/8 가격에 Gemini 2.5 Flash 동등 성능

Google이 Gemini 3.1 Flash-Lite를 개발자 프리뷰로 출시했다. 입력 $0.25/1M 토큰(Pro의 1/8 수준), 출력 $1.50/1M 토큰이며, Gemini 2.5 Flash 대비 Time to First Token 2.5배 향상, 출력 속도 45% 향상을 달성하면서 핵심 성능 지표에서는 Gemini 2.5 Flash와 동등하다.

AI
모델
읽기
2026년 4월 2일

vLLM Model Runner V2 출시 — Prefill-Decode 분리 스케줄링으로 오픈소스 LLM 추론 아키텍처 혁신

2026년 3월, vLLM 프로젝트가 Model Runner V2(MRV2)를 릴리즈했다. 기존 스케줄러 아키텍처를 전면 재설계하여 Prefill-Decode 완전 분리 스케줄링과 Zero-Copy DMA 전송을 도입했다. HuggingFace 대비 24배 처리량을 유지하며 GitHub 스타 74,900개로 프로덕션 LLM 추론 엔진의 사실상 표준 위치를 공고히 했다.

AI
오픈소스
읽기
2026년 4월 2일

The Claude Code Source Leak: fake tools, frustration regexes, undercover mode

Anthropic은 실수로 npm 패키지에 소스 맵을 제공하여 전체 Claude Code 소스를 노출시켰습니다. 내부에서 찾은 내용은 다음과 같습니다.

트렌드
AI
읽기
2026년 4월 2일

Google Gemini Code Assist, 개인 개발자 무료 전환 — Gemini 2.5 기반 일 6,000회 코딩 요청 제공

Google이 Gemini Code Assist를 개인 개발자에게 완전 무료로 전면 개방했다. Gemini 2.5 기반으로 VS Code, JetBrains, Android Studio를 지원하며 일 6,000회 코드 요청과 240회 채팅이 무료로 제공된다. 신용카드 없이 개인 Gmail 계정으로 즉시 이용 가능하다.

AI
무료
읽기
2026년 4월 2일

PrismML Bonsai — 세계 최초 상용 가능 1-bit LLM, iPhone에서 44 tok/s 달성

PrismML이 2026년 3월 31일 세계 최초로 상용 수준 1-bit LLM 'Bonsai' 시리즈를 공개했다. 8B·4B·1.7B 세 가지 모델을 Apache 2.0 라이센스로 무료 배포하며, 기존 FP16 대비 메모리를 14배 절감하고 추론 속도를 8배 높이면서도 동급 모델과 동일한 벤치마크 성능을 유지한다.

AI
오픈소스
읽기
2026년 4월 2일

Q1 2026 글로벌 VC $3,000억 사상 최고치 — AI가 전체 81% 독식, 단 4개 딜이 전체의 65% 차지

Crunchbase에 따르면 2026년 1분기 글로벌 벤처 투자가 $3,000억(약 410조 원)으로 사상 최고치를 기록했다. 전분기 대비 150% 이상 증가했으며, AI 기업이 전체의 81%인 $2,420억을 흡수했다. OpenAI($1,220억), Anthropic($300억), xAI($200억), Waymo($160억) 단 4개 딜이 전체의 65%를 차지했다.

AI
트렌드
읽기
2026년 4월 2일

캘리포니아 Newsom, 미국 최초 주정부 AI 안전 행정명령 서명 — 주계약 AI 기업에 안전·프라이버시 가이드라인 의무화

캘리포니아 주지사 Gavin Newsom이 2026년 3월 30일 미국 주정부 최초로 AI 안전 행정명령을 서명했다. 주정부와 계약을 맺는 AI 기업은 안전·프라이버시·편향 방지 가이드라인을 의무 준수해야 하며, 120일 내 세부 AI 벤더 인증 체계가 수립된다.

AI
트렌드
읽기
2026년 4월 2일

Claude Code 내부 작동 원리 — 에이전트 루프, 컨텍스트 조립, 도구 실행 구조 해설

Claude Code의 내부 작동 구조를 상세히 설명하는 문서. 터미널 기반 에이전트 루프(요청 수신 → 추론 → 도구 호출 → 결과 관찰 → 반복), 컨텍스트 조립(git status, CLAUDE.md, 도구 목록), 권한 모델, 로컬 실행 아키텍처, Task 도구 기반 멀티 에이전트 구조까지 다룬다.

개발도구
AI
읽기
2026년 4월 2일

Claw Code — Claude Code 소스 기반 Python/Rust 클린룸 재구현 프로젝트 (130k★)

Claude Code 소스 공개를 계기로 탄생한 클린룸 재구현 프로젝트. Python + Rust로 에이전트 하네스 아키텍처를 재구현했다. 출시 2시간 만에 50k 스타, 현재 130k 스타 / 102k 포크. Sigrid Jin이 발기인.

트렌드
오픈소스
읽기
2026년 4월 1일

NVIDIA Nemotron 3 Super — 120B MoE 오픈소스 에이전트 모델, SWE-Bench 60.5% 달성

NVIDIA가 에이전트 워크로드 특화 오픈소스 모델 Nemotron 3 Super를 공개했다. Mamba-Transformer 하이브리드 MoE 아키텍처로 원래 1,200억 파라미터에서 활성 파라미터 120억만 사용, SWE-Bench Verified 60.47% 및 PinchBench 85.6%로 동급 오픈소스 최고 성능을 기록했다.

트렌드
오픈소스
읽기
2026년 4월 1일

Linux Foundation, MCP 기부 및 AAIF 출범 — AI 에이전트 표준화의 중립 거버넌스 시대 개막

Linux Foundation이 Anthropic의 MCP, Block의 goose, OpenAI의 AGENTS.md를 함칠 에이전틱 AI 파운데이션(AAIF)을 출범했다. AWS, Google, Microsoft, Cloudflare 등이 플래티덧 멤버로 참여하며, MCP는 특정 기업 소유가 아닌 인터넷 인프라 수준의 중립 표준 프로토콜로 전환된다.

트렌드
AI
읽기
2026년 4월 1일

Google TurboQuant — LLM KV 캐시 메모리 6배 압축, H100에서 8배 속도 향상

Google Research가 LLM의 KV 캐시 메모리를 6배 압축하면서 정확도 손실이 없는 알고리즘 TurboQuant를 공개했다. 16비트에서 3비트로의 훈련 없는(training-free) 압축으로 NVIDIA H100에서 최대 8배의 어텐션 연산 속도 향상을 달성하며, ICLR 2026 발표 예정이다.

트렌드
AI
읽기
2026년 4월 1일

OpenAI, $122B 펀딩 완료 — $852B 밸류에이션으로 IPO 전 최대 사모 투자 기록

OpenAI가 Amazon($50B), SoftBank($30B), NVIDIA($30B) 등 주요 투자자들로부터 $122B(약 174조원)를 조달해 밸류에이션 $852B(약 1,200조원)를 달성했다. 월 매출 $2B, 주간 활성 사용자 9억 명을 기록하며 IPO를 앞두고 있다.

트렌드
AI
읽기
2026년 4월 1일

Claude Code's source code has been leaked via a map file in their NPM registry

소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 4월 1일

Anthropic Claude Code npm 패키징 오류로 51만 줄 소스코드 유출 — KAIROS 자율 데몬 모드·미공개 모델 코드네임 노출

2026년 3월 31일, @anthropic-ai/claude-code npm 패키지 v2.1.88에 내부 디버깅용 소스맵 파일이 실수로 포함되어 약 1,900개 TypeScript 파일(51만 2천 줄)이 공개됐다. GitHub에서 4만 1천 500회 이상 포크되며 확산됐고, Anthropic은 고객 데이터·자격증명 노출은 없었다고 공식 확인했다.

AI
Claude
읽기
2026년 4월 1일

Google TurboQuant, LLM KV 캐시 메모리 6배 압축·H100 속도 8배 향상 달성

Google Research가 ICLR 2026에서 발표할 TurboQuant를 공개했다. 별도 학습 없이 LLM의 KV 캐시를 3비트로 압축해 메모리를 6배 절감하고, NVIDIA H100에서 어텐션 연산 속도를 최대 8배 높이면서도 정확도 손실이 없다.

AI
트렌드
읽기
2026년 4월 1일

GPT-5.4 출시 — 추론·코딩·에이전트 통합 모델, OSWorld-V 인간 기준선 AI 최초 초과

OpenAI가 3월 5일 GPT-5.4를 출시했다. GPT-5.3 Codex의 코딩 역량을 메인라인 추론 모델에 통합한 것으로, 100만 토큰 컨텍스트 윈도우와 멀티스텝 에이전트 워크플로우 자율 실행 능력을 탑재했다. 실제 데스크톱 생산성 태스크를 시뮬레이션하는 OSWorld-V 벤치마크에서 75%를 기록, 인간 기준선(72.4%)을 AI 최초로 초과했다.

AI
모델
읽기
2026년 4월 1일

OpenAI, 최초 오픈웨이트 모델 gpt-oss-120b 공개 — Apache 2.0, o4-mini 수준 추론 성능

OpenAI가 처음으로 오픈웨이트 모델인 gpt-oss-120b(117B 파라미터, MoE)와 gpt-oss-20b를 Apache 2.0 라이선스로 공개했다. 단일 80GB GPU에서 실행 가능하며, 코딩·수학·툴 사용에서 o4-mini와 동등하거나 일부 초과한다.

AI
오픈소스
읽기
2026년 4월 1일

gstack — Garry Tan(YC 회장)이 만든 AI 소프트웨어 팩토리

Y Combinator 회장 Garry Tan이 만든 Claude Code 기반 AI 소프트웨어 팩토리. 23개의 전문화된 AI 역할(경영진, 엔지니어링, 디자인, QA, 보안 등)을 조합해 10~15개 스프린트를 병렬로 돌린다. 60일간 60만 줄 프로덕션 코드 산출, 일일 1~2만 줄 생산량. GitHub 스타 60.1k.

트렌드
오픈소스
읽기
2026년 4월 1일

Paperclip — AI 에이전트 팀을 회사처럼 운영하는 오케스트레이션 플랫폼

여러 AI 에이전트를 하나의 회사 조직처럼 구성하고 운영하는 오픈소스 오케스트레이션 플랫폼. 조직도, 목표 정렬, 예산 관리, 거버넌스(승인 게이트, 롤백, 감사 로그)까지 갖추고 있다. "OpenClaw이 직원이라면 Paperclip은 회사다." GitHub 스타 42.8k.

트렌드
오픈소스
읽기
2026년 3월 31일

Google TurboQuant — KV 캐시를 3비트로 6배 압축, 재학습 없이 H100에서 8배 처리량

Google의 TurboQuant가 ICLR 2026에서 발표될 예정이다. LLM의 KV 캐시를 3~4비트로 압축해 메모리를 4~6배 절감하면서 정확도 손실이 전혀 없고, H100 GPU에서 32-bit 대비 최대 8배 처리량 향상을 달성한다.

AI
모델
읽기
2026년 3월 31일

GPT-5.4 출시 — 컴퓨터 사용 에이전트로 인간 기준선(OSWorld 72%) 돌파

OpenAI는 3월 29일 GPT-5.4를 출시했다. 컴퓨터 사용(computer use)을 핵심 역량으로 탑재하여 OSWorld-Verified 벤치마크에서 75%를 기록, 인간 평균(72%)을 처음으로 추월했다.

AI
모델
읽기
2026년 3월 31일

Mistral Voxtral TTS — 4B 오픈소스 음성 합성 모델, ElevenLabs 대비 7~9배 저렴

Mistral AI가 3월 26일 오픈소스 텍스트-음성 변환 모델 Voxtral TTS(4B 파라미터)를 출시했다. 9개 언어를 지원하고 5초 이하의 음성 샘플로 목소리를 복제하며, 첫 오디오 출력 지연(TTFA)이 90ms에 불과해 실시간 음성 에이전트 구현이 가능하다.

AI
모델
읽기
2026년 3월 31일

NVIDIA Nemotron 3 Super — 120B Mamba-Transformer MoE 오픈 에이전트 모델, 이전 대비 5배 처리량

NVIDIA가 에이전트 AI 특화 오픈 모델 Nemotron 3 패밀리를 출시했다. 플래그십인 Nemotron 3 Super는 120B 파라미터(활성 12B)의 Mamba-Transformer MoE 하이브리드 아키텍처를 채택해 Nemotron 2 대비 5배 처리량을 달성하고 1M 토큰 컨텍스트 윈도우를 지원한다.

AI
모델
읽기
2026년 3월 31일

Cursor, 유료 개발자 100만 명 돌파 — 병렬 서브에이전트 & BugBot으로 AI 코딩 '5가데일' 재정의

AI 코드 에디터 Cursor가 유료 개발자 100만 명을 돌파하고, 2026년 3월 병렬 서브에이전트와 BugBot을 공식 출시했다. BugBot은 월 200만 건 이상의 PR을 자동 리뷰하며 70% 버그 해결률을 기록 중이다.

AI
개발도구
읽기
2026년 3월 31일

Google TurboQuant — LLM KV 캐시 3.5비트 압쳙으로 메모리 6배 절감, 오픈소스 공개

Google이 LLM의 KV-캐시를 채널당 3.5비트로 압쳙하는 오픈소스 양자화 기법 TurboQuant를 공개했다. 메모리 사용량을 최대 6배 줄이고 추론 속도를 대폭 향상시킨다.

AI
모델
읽기
2026년 3월 31일

OpenAI, $1,200억 역대 최대 평더링 완료 — Amazon $500억 주도, 기업가치 $7,300억 돌파

OpenAI가 Amazon $500억, Nvidia·SoftBank 각 $300억 등으로 구성된 총 $1,200억 평더링 라운드를 마무리했다. Pre-money 기업가치 $7,300억으로, 2026년 AI 산업 내 최대 단일 투자 이벤트다.

AI
OpenAI
읽기
2026년 3월 31일

Anthropic Mythos 유출 — 코딩·사이버보안 SOTA, "역량의 단계적 도약" 확인

Anthropicが내부 테스트 중이던 신규 모델 'Mythos(Claude Mythos/Opus 5)'가 데이터 유출로 공개됐다. 소프트웨어 코딩, 학술 추론, 사이버보안 영역에서 Claude Opus 4.6 대비 "극적으로 높은 점수"를 기록한 것으로 알려졌다.

AI
모델
읽기
2026년 3월 31일

MCP 9,700만 설치 돌파 — AI 에이전트 인프라 표준으로 안착, 그러나 보안 위협도 급부상

Anthropicの Model Context Protocol(MCP)이 2026년 3월 25일 기준 9,700만 설치를 달성했다. OpenAI, Google DeepMind, Cohere, Mistral 등 주요 AI 제공업체 모두 자사 에이전트 프레임워크에 MCP 지원을 통합 완료했다.

AI
API
읽기
2026년 3월 30일

Alibaba Qwen 3.5 소형 모델 공개 — 9B 파라미터로 GPT-OSS-120B 능가, Apache 2.0 오픈소스

Alibaba가 0.8B, 2B, 4B, 9B 파라미터 4종의 Qwen 3.5 소형 모델을 Apache 2.0 라이선스로 공개했다. 9B 모델이 GPQA Diamond 벤치마크에서 81.7점을 기록해 GPT-OSS-120B(71.5점)를 13.6% 앞질렀다.

AI
모델
읽기
2026년 3월 30일

Google TurboQuant, LLM KV 캐시 메모리 6배 절감 — 3-bit 양자화로 H100에서 8배 속도 향상

Google Research가 공개한 TurboQuant는 3-bit 벡터 양자화 기법을 통해 LLM의 KV 캐시 메모리를 6배 줄이면서 H100 GPU에서 최대 8배 추론 속도 향상을 달성했다. 정확도 손실 없이 이를 구현한 점이 핵심이다.

AI
모델
읽기
2026년 3월 30일

Mistral Small 4 (22B), 오픈소스 추론 벤치마크 1위 — 자기 3~5배 규모 클로즈드 모델 추월

프랑스 Mistral AI가 공개한 22B 파라미터의 Mistral Small 4가 추론 및 지시 수행 벤치마크에서 자신보다 3~5배 큰 클로즈드 모델들을 앞질렀다. Apache 2.0 라이선스로 제공되며 상업적 이용도 자유롭다.

AI
모델
읽기
2026년 3월 30일

OpenAI, $1100억 투자 유치 — $7300억 밸류에이션, 연 매출 $250억 돌파로 AI 경제 새 이정표

OpenAI가 SoftBank($300억), NVIDIA($300억), Amazon($500억) 등으로부터 총 $1,100억 규모의 신규 투자를 유치하며 기업가치 $7,300억을 기록했다. 연간 반복 매출(ARR)도 $250억을 돌파해 출시 3년 만에 사상 최대 AI 기업으로 굳어졌다.

AI
OpenAI
읽기
2026년 3월 30일

Yann LeCun의 AMI Labs, 유럽 역대 최대 시드 $10.3억 조달 — NVIDIA·베이조스 익스피디션 참여

튜링상 수상자 Yann LeCun이 설립한 Advanced Machine Intelligence(AMI) Labs가 유럽 역사상 최대 시드 라운드인 $10.3억을 $35억 밸류에이션으로 유치했다. NVIDIA, Bezos Expeditions, Temasek이 참여했다.

AI
모델
읽기
2026년 3월 30일

Anthropic, 데이터 누출로 공개된 차세대 모델 'Claude Mythos' — 사이버보안 역사상 가장 강력한 AI

Anthropicが 비보안 데이터 캐시를 통해 실수로 유출된 내부 코드명 'Capybara'(공개명 Claude Mythos)는 현존 최고 모델인 Claude Opus 4.6 대비 코딩·추론·사이버보안 모든 벤치마크에서 급격한 성능 향상을 보이는 차세대 최대급 모델이다.

AI
Claude
읽기
2026년 3월 30일

Google TurboQuant, LLM KV 캐시 6배 압축 — 재학습 없이 H100에서 8배 처리량 향상

Google Research가 ICLR 2026에서 발표한 TurboQuant는 LLM 추론의 가장 큰 메모리 병목인 KV 캐시를 3~4비트로 압축해 메모리 사용량을 최대 6배 절감하는 알고리즘으로, 재학습이나 파인튜닝 없이 적용 가능하며 품질 손실이 사실상 없다.

AI
모델
읽기
2026년 3월 30일

Mistral Small 4, 119B MoE 모델 Apache 2.0 오픈소스 출시 — GPT-OSS 120B 능가하며 추론 효율도 앞서

Mistral AI가 3월 중순 출시한 Mistral Small 4는 119B 파라미터 Mixture-of-Experts(MoE) 구조의 오픈소스 모델로, Apache 2.0 라이선스 하에 상업적 무제한 사용이 가능하며 토큰당 활성 파라미터는 6B에 불과해 추론 속도가 매우 빠르다.

AI
오픈소스
읽기
2026년 3월 30일

OpenAI, Sora 앱 및 API 완전 종료 — 하루 $100만 적자에 500만 이하 사용자로 붕괴한 AI 비디오 경제학

OpenAI가 2026년 3월 24일 Sora 앱과 Sora.com 서비스를 종료한다고 발표했다. Sora는 하루 약 $100만의 컴퓨팅 비용을 소모하면서 누적 인앱 결제 수익은 $210만에 그쳤고, 피크 사용자 수 100만을 기록한 이후 50만 이하로 붕괴했다.

AI
OpenAI
읽기
2026년 3월 30일

Anthropic 'Claude Mythos(Capybara)' 유출 — Opus 4.6 대비 코딩·추론·사이버보안 SOTA, 전례 없는 보안 리스크 공식 경고

Anthropic이 내부 테스트 중이던 차세대 모델 'Claude Mythos(코드명 Capybara)'의 상세 스펙이 unsecured 데이터 스토어를 통해 공개적으로 유출됐다. Anthropic은 이를 '현재까지 개발한 가장 강력한 모델'로 규정하며 코딩·학술 추론·사이버보안 벤치마크에서 Claude Opus 4.6 대비 드라마틱한 수치 향상을 확인했다고 밝혔다.

AI
Claude
읽기
2026년 3월 30일

ARC-AGI-3 출시 — 인간 100% vs 최고 AI 0.37%, 진정한 적응 학습을 요구하는 새로운 AGI 벤치마크

François Chollet과 Mike Knoop의 ARC Prize 재단이 ARC-AGI-3를 공개했다. 135개의 오리지널 인터랙티브 환경으로 구성된 이 벤치마크에서 인간은 100%를 달성한 반면, 최고 성능 AI인 Gemini 3.1 Pro는 고작 0.37%에 그쳤다 — GPT-5.4는 0.26%, Claude Opus 4.6은 0.25%다.

AI
트렌드
읽기
2026년 3월 30일

MCP, 월 9700만 다운로드 돌파 — 16개월 만에 React 수준 생태계, AI 에이전트 필수 인프라로 공식화

Model Context Protocol(MCP) SDK의 월간 다운로드가 2026년 3월 기준 9700만 건을 돌파했다. 2024년 11월 Anthropic이 출시했을 당시 약 200만 건이었던 수치가 16개월 만에 4,750% 성장한 것으로, React npm 패키지가 1억 다운로드에 도달하는 데 걸린 3년 대비 절반의 시간이다.

AI
트렌드
읽기
2026년 3월 30일

Mistral Small 4 출시 — 119B MoE (활성 6.5B), Apache 2.0, 추론·멀티모달·코딩 단일 모델 통합

Mistral AI가 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 총 119B 파라미터의 MoE 아키텍처로 활성 파라미터는 6.5B에 불과하지만, 기존에 별도 모델로 운용하던 Magistral(추론), Pixtral(멀티모달), Devstral(에이전트 코딩) 세 가지 역량을 256K 컨텍스트 창 하나로 통합했다.

AI
오픈소스
읽기
2026년 3월 29일

Google AI Studio, Antigravity 에이전트 + Firebase로 풀스택 바이브 코딩 환경 출시

Google이 2026년 3월 18일 AI Studio에 Antigravity 코딩 에이전트와 Firebase 백엔드를 통합한 풀스택 바이브 코딩 환경을 공개했다. 자연어 프롬프트 하나로 Firestore DB, Firebase Authentication, Cloud Run 배포까지 자동 구성되는 프로덕션 레디 앱 생성이 가능하다.

AI
개발도구
읽기
2026년 3월 29일

OpenAI, Sora 공식 종료 — 일 $1,500만 적자 끝에 컴퓨트 자원 로보틱스로 전면 재배치

OpenAI가 2026년 3월 24일 AI 영상 생성 서비스 Sora를 공식 종료했다. 서비스 전체 누적 매출이 $210만에 불과한 반면 일일 추론 비용은 약 $1,500만으로 구조적 적자가 지속됐으며, 해당 컴퓨트 자원은 로보틱스 및 세계 시뮬레이션 연구로 전면 재배치된다.

AI
OpenAI
읽기
2026년 3월 29일

Shopify Agentic Storefronts 전면 활성화 — 5.6M 가맹점, ChatGPT·Gemini·Copilot에서 기본 판매 시작

Shopify가 미국 내 5.6M 이상의 가맹점을 대상으로 ChatGPT, Google AI Mode, Microsoft Copilot, Gemini 앱 내 직접 상품 노출을 기본 활성화했다. 2026년 3월 24일부터 별도 설정 없이 Shopify 가맹점의 제품이 AI 대화 채널에 자동 노출되며, 구매는 가맹점 스토어로 연결된다.

AI
트렌드
읽기
2026년 3월 29일

AI 스타트업, 벤처 캐피털의 41% 독식 — $128B 시장에서 역대 최고 점유율

TechCrunch에 따르면 2026년 3월 현재 AI 스타트업이 전체 VC 투자($128B)의 41%를 흡수하며 역대 최고치를 기록했다. 3월 초 2주 만에 $100M+ 라운드가 어느 비교 기간보다 많이 발생했으며, xAI $20B, OpenAI $110B, Anthropic $30B 등 메가라운드가 잇따랐다.

AI
트렌드
읽기
2026년 3월 29일

Alibaba Qwen 3.5 Small 시리즈 출시: 9B 모델이 GPT 120B를 벤치마크에서 앞질러

Alibaba가 Qwen 3.5 Small 시리즈(0.8B·2B·4B·9B)를 Apache 2.0 라이선스로 오픈소스 공개했다. 9B 모델의 GPQA 점수 81.7로 OpenAI의 GPT-OSS-120B(71.5)를 벤치마크에서 앞질렀다.

AI
오픈소스
읽기
2026년 3월 29일

Gartner: 2030년까지 1조 파라미터 LLM 추론 비용 90% 하락 예측

Gartner가 2030년까지 1조 파라미터 규모 LLM의 추론 비용이 2025년 대비 90% 이상 하락할 것으로 공식 예측했다. 하드웨어 개선, 모델 압축(양자화·증류), 추론 최적화 기술이 복합적으로 작용하는 결과다.

AI
트렌드
읽기
2026년 3월 29일

Google TurboQuant: KV-cache 6배 압축으로 LLM 메모리 혁신, ICLR 2026 발표

Google이 ICLR 2026에서 TurboQuant를 발표했다. KV-cache를 채널당 3.5비트로 압축해 메모리 사용량을 6배 줄이는 소프트웨어 레벨의 LLM 효율화 기법이다.

AI
트렌드
읽기
2026년 3월 29일

Physical Intelligence, $11B 밸류에이션으로 $1B 펀딩 논의 중 — 로보틱스 AI 붐 정점

Ex-Google DeepMind 연구진이 창업한 Physical Intelligence(π)가 $11B 밸류에이션으로 $1B 투자 라운드를 협의 중이다. VLA(Vision-Language-Action) 모델 기반의 범용 로봇 제어 파운데이션 모델을 개발하고 있다.

AI
트렌드
읽기
2026년 3월 28일

SoftBank, OpenAI 지분 확대 위해 역대 최대 $400억 브릿지론 조달 — IPO 시그널 주목

SoftBank가 OpenAI의 $1,100억 라운드 투자 약정($300억) 이행을 위해 JPMorgan, Goldman Sachs, 미즈호, SMBC, MUFG 등 5개 은행으로부터 12개월 만기 $400억 무담보 브릿지론을 조달했다. 만기는 2027년 3월로 OpenAI IPO 예상 윈도우와 정확히 일치한다.

AI
OpenAI
읽기
2026년 3월 28일

Apple, iOS 27에서 Siri에 Claude·Gemini 통합 — 멀티모델 AI 플랫폼으로 전환 선언

Apple이 iOS 27에서 Siri를 경쟁 AI 어시스턴트(Google Gemini, Anthropic Claude 포함)에 개방하고, 질문을 다양한 AI 프로바이더로 라우팅하는 멀티모델 전략을 발표했다. 동시에 Siri 자체도 화면 인지 및 맥락 기반 응답 기능을 대폭 강화한다.

AI
트렌드
읽기
2026년 3월 28일

Google TurboQuant: LLM KV-Cache 6배 압축 달성, 메모리 반도체 시장 직격

Google이 ICLR 2026에서 발표한 TurboQuant 양자화 기술은 LLM의 KV-Cache를 채널당 3.5비트로 압축하여 메모리 사용량을 최대 6배 감소시키면서도 모델 품질을 유지("absolute quality neutrality")하는 데 성공했다. 이 결과로 Micron 등 AI 메모리 공급업체 주가가 즉각 하락했다.

AI
모델
읽기
2026년 3월 28일

Harvey, $2억 투자 유치 — 법률 AI 밸류에이션 $110억으로 버티컬 AI 전성시대 개막

법률 AI 스타트업 Harvey가 신규 $2억 라운드를 $110억 밸류에이션으로 마감했다. 이는 파운데이션 모델 레이어가 아닌 특정 버티컬 산업에 집중한 AI 애플리케이션 기업이 메가캡 평가를 받는 사례로, VC 자금이 수직 계열화(vertical specialization)로 이동하고 있음을 보여준다.

AI
트렌드
읽기
2026년 3월 28일

Mistral Small 4 (22B, Apache 2.0): 자신보다 3~5배 큰 클로즈드 모델 추론 성능 압도

Mistral AI가 220억 파라미터 규모의 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 추론 및 지시 수행 벤치마크에서 파라미터 수가 3~5배 많은 클로즈드 모델 여러 개를 상회하는 성능을 보였다.

AI
모델
읽기
2026년 3월 28일

Yann LeCun의 AMI Labs, 유럽 최대 시드 $10.3억 조달 — JEPA 월드모델로 Transformer 패러다임에 정면 도전

Meta AI 수석 과학자 Yann LeCun이 설립한 AMI Labs가 유럽 역사상 최대 시드 라운드인 $10.3억을 조달했다. Bezos, Nvidia, Samsung, Temasek이 참여했으며, 목표는 JEPA(Joint Embedding Predictive Architecture) 기반의 월드모델(world model)을 구축하는 것이다.

AI
모델
읽기
2026년 3월 27일

GitHub Copilot, 4월 24일부터 사용자 코드 데이터를 AI 훈련에 기본 활용 (opt-in 전환)

GitHub이 3월 25일 개인정보처리방침을 개정, 2026년 4월 24일부터 Copilot Free/Pro/Pro+ 사용자의 인터랙션 데이터(입력·출력 코드, 커서 주변 콘텐츠, 파일 구조, 탐색 패턴, 피드백 포함)를 기본 opt-in으로 AI 훈련에 활용한다고 발표했다. Copilot Business·Enterprise 사용자는 적용 제외다.

트렌드
AI
읽기
2026년 3월 27일

Google TurboQuant — LLM KV 캐시 6배 압축, 정확도 손실 제로 달성 (ICLR 2026)

Google이 LLM의 KV 캐시를 기존 16비트에서 3비트로 압축해 메모리 사용량을 최소 6배 줄이면서도 정확도 손실이 없는 알고리즘 TurboQuant를 공개했다. ICLR 2026에서 정식 발표 예정이며, H100 GPU에서 4비트 적용 시 32비트 대비 최대 8배 추론 성능 향상이 확인됐다.

트렌드
AI
읽기
2026년 3월 27일

Mistral Small 4 출시 — 119B MoE, 친지드 추론+비전 통합, Apache 2.0 오픈소스

Mistral AI가 3월 17일 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 119B 파라미터 MoE 구조로 추론 시 약 22B만 활성화되며, 256K 컨텍스트 윈도우와 멀티모달(비전) 기능을 단일 모델에 통합했다. 전작 Small 3 대비 엔드투엔드 완료 시간 40% 단축, 처리량 3배 향상을 달성했다.

오픈소스
무료
읽기
2026년 3월 27일

NVIDIA Nemotron 3 Super 공개 — 120B 하이브리드 MoE 오픈 에이전틱 AI 모델 Apache 2.0

NVIDIA가 GTC 2026에서 120B 전체 파라미터, 12B 활성 파라미터의 하이브리드 Mamba-Transformer MoE 아키텍처 기반 오픈 웨이트 모델 Nemotron 3 Super를 Apache 2.0으로 공개했다. 소프트웨어 개발과 사이버보안 트리아지 등 복잡한 멀티에이전트 태스크를 타겟으로 하며, 10조 토큰 규모의 학습 데이터도 함께 공개됐다.

오픈소스
AI
읽기
2026년 3월 27일

ARC-AGI-3 출시 — 프론티어 모델 전부 1% 미만, AGI와의 간극 재확인

ARC Prize가 3월 25일 ARC-AGI-3을 공식 출시했다. 텍스트 지시 없이 낯선 환경을 탐색하며 목표를 스스로 설정해야 하는 인터랙티브 추론 과제로 구성되며, 인간은 100% 해결하는 반면 GPT-5.4(0.26%), Claude Opus 4.6(0.25%), Gemini 3.1 Pro(0.37%), Grok-4.20(0.00%) 등 최상위 프론티어 모델은 모두 1% 미만을…

트렌드
AI
읽기
2026년 3월 27일

Cursor, ARR $2B 달성 — 3개월 만에 매출 2배, SaaS 역사상 최단 스케일업

AI 코딩 도구 Cursor(Anysphere)가 출시 24개월 만에 ARR $1B을 돌파한 데 이어 2026년 3월 기준 ARR $2B을 달성했다. 단 3개월 만에 매출이 2배가 된 셈으로, $50B 기업가치를 목표로 후속 투자 라운드를 준비 중인 것으로 알려졌다.

AI
트렌드
읽기
2026년 3월 27일

Google TurboQuant, LLM KV 캐시 6배 압축 — 정확도 손실 0%

Google Research가 LLM의 KV(Key-Value) 캐시를 3비트로 압축해 메모리를 6배 절감하면서도 정확도 손실이 전혀 없는 알고리즘 TurboQuant를 공개했다. Nvidia H100 기준 Attention 연산 속도 최대 8배 향상을 기록하며 ICLR 2026에 채택됐다.

AI
트렌드
읽기
2026년 3월 27일

Mistral Small 4 출시 — 119B MoE, 추론·비전·코딩 통합 오픈소스 모델 (Apache 2.0)

Mistral AI가 2026년 3월 16일, 119B 파라미터 Mixture-of-Experts 아키텍처의 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 토큰당 활성 파라미터는 6B으로, 기존 Magistral(추론), Pixtral(비전), Devstral(에이전트 코딩) 세 모델의 기능을 하나로 통합했다.

AI
오픈소스
읽기
2026년 3월 27일

Mistral Voxtral TTS 공개 — 5초 샘플로 음성 복제, 9개 언어 엣지 배포 가능

Mistral AI가 2026년 3월 26일 오픈소스 TTS(텍스트-음성 변환) 모델 Voxtral TTS를 공개했다. Ministral 3B 기반으로 영어·프랑스어·독일어 등 9개 언어를 지원하며, 5초 미만의 음성 샘플로 커스텀 음성 복제가 가능하다. 첫 음성까지 지연(TTFA)은 90ms, 실시간 팩터(RTF)는 6x를 달성했다.

AI
오픈소스
읽기
2026년 3월 27일

Nvidia GTC 2026: 에이전트 AI 시대 선언 — NemoClaw·Agent Toolkit 오픈소스 공개

Nvidia GTC 2026에서 Jensen Huang은 AI 패러다임이 '프롬프트-응답' 챗봇에서 자율적으로 계획하고 행동하는 에이전트로 전환됐음을 선언했다. 에이전트 보안 레이어 NemoClaw와 오픈소스 에이전트 개발 플랫폼 NVIDIA Agent Toolkit을 공개하며, Salesforce·SAP·Adobe·ServiceNow 등 주요 엔터프라이즈 파트너와의 생태계를 구축했다.

AI
트렌드
읽기
2026년 3월 26일

AI 개발 도구, '어시스턴트'에서 '자율 에이전트'로 전환 가속 — March 2026 생태계 동향

Gemini CLI(Google), n8n 네이티브 AI 에이전트 빌더, Dapr Agents v1.0 등 자율 실행 가능한 에이전트형 개발 도구들이 2026년 3월을 기점으로 일제히 프로덕션 단계로 진입했다. 코드 자동완성을 넘어 복잡한 멀티스텝 워크플로우를 자율 실행하는 패러다임 전환이 선명해지고 있다.

AI
개발도구
읽기
2026년 3월 26일

Alibaba Qwen 3.5 Small: 9B 모델이 GPT-oss-120B를 GPQA Diamond에서 추월

Alibaba가 0.8B, 2B, 4B, 9B 네 가지 크기의 Qwen 3.5 Small 시리즈를 Apache 2.0 라이선스로 공개했다. 텍스트, 이미지, 비디오를 네이티브 멀티모달로 처리하며, 9B 모델이 GPQA Diamond 벤치마크에서 81.7점을 기록해 GPT-oss-120B(71.5점)를 상회했다.

AI
오픈소스
읽기
2026년 3월 26일

Dapr Agents v1.0 GA: 프로덕션 AI 에이전트의 Kubernetes 클라우드 네이티브 표준

CNCF(Cloud Native Computing Foundation)가 KubeCon + CloudNativeCon Europe 2026(암스테르담)에서 Dapr Agents v1.0 정식 출시를 발표했다. NVIDIA와 오픈소스 커뮤니티가 1년간 협업한 이 Python 프레임워크는 내구성 있는 워크플로우 엔진, 상태 관리, 안전한 멀티 에이전트 조율 기능을 제공한다.

AI
개발도구
읽기
2026년 3월 26일

Google TurboQuant: LLM KV 캐시 6배 압축, 정확도 손실 제로 달성

Google 리서치팀이 LLM의 KV(Key-Value) 캐시를 6배 압축하면서도 정확도 손실이 전혀 없는 새로운 양자화 알고리즘 TurboQuant를 공개했다. NVIDIA H100 GPU 기준 어텐션 연산 속도를 최대 8배 향상시키며, 재학습이나 파인튜닝 없이 즉시 적용 가능하다.

AI
모델
읽기
2026년 3월 26일

OpenAI, GPT-oss-120B/20B 오픈 웨이트 모델 Apache 2.0으로 공개

OpenAI가 GPT-oss-120B(MoE, 활성 파라미터 5.1B)와 GPT-oss-20B 두 모델을 Apache 2.0 라이선스로 Hugging Face에 공개했다. GPT-oss-120B는 단일 80GB GPU(H100, MI300X)에서 실행 가능하며, 핵심 추론 벤치마크에서 o4-mini에 근접하는 성능을 기록한다.

AI
오픈소스
읽기
2026년 3월 26일

Anthropic Economic Index 3월 보고서 — AI 사용자 학습곡선과 경제적 영향 분석

Anthropic이 Claude 사용 패턴 기반 경제 인덱스 3월 보고서를 발표했다. 핵심 발견은 장기 사용자(6개월+)가 신규 사용자 대비 4~5%p 높은 성공률을 보이며, 더 복잡한 고부가가치 작업에 AI를 활용한다는 것. 동시에 전체 사용자 풀은 저숙련·개인용 방향으로 확대되는 양극화가 진행 중.

트렌드
AI
읽기
2026년 3월 26일

Anthropic, 장시간 AI 앱 개발을 위한 Harness Design 패턴 공개

Anthropic이 Claude가 장시간(최대 6시간) 복잡한 앱을 자율적으로 빌드할 때 품질을 유지하기 위한 멀티 에이전트 하네스(Harness) 설계 패턴을 공개했다. GAN에서 영감받은 생성자-평가자 분리 구조로, Planner → Generator → Evaluator 3단 파이프라인을 통해 단일 에이전트 대비 압도적 품질 향상을 입증.

트렌드
AI
읽기
2026년 3월 11일

A GitHub Issue Title Compromised 4k Developer Machines

GitHub 문제에 대한 즉각적인 주입으로 연쇄 반응이 발생하여 4,000명의 개발자가 동의 없이 OpenClaw를 설치하게 되었습니다. 이 공격은 잘 알려진 취약점을 새로운 것으로 구성합니다. 하나의 AI 도구가 다른 AI 도구를 부트스트랩합니다.

트렌드
AI
읽기
2026년 3월 10일

LLMs work best when the user defines their acceptance criteria first

데이터베이스에서 실행할 수 있는 가장 간단한 테스트 중 하나는 다음과 같습니다.

트렌드
AI
읽기
2026년 3월 9일

The L in "LLM" Stands for Lying

AI 사용의 불가피성에 대한 질문

트렌드
AI
읽기
2026년 3월 8일

Tell HN: I'm 60 years old. Claude Code has re-ignited a passion

Tell HN: I'm 60 years old. Claude Code has re-ignited a passion | Hacker News 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 3월 7일

Dario Amodei calls OpenAI’s messaging around military deal ‘straight up lies’

Anthropic은 AI 안전 불일치로 인해 국방부와의 계약을 포기했습니다. 그러자 OpenAI가 급습했습니다.

트렌드
AI
읽기
2026년 3월 6일

GPT-5.4

GPT-5.4 소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 3월 5일

Claude's Cycles [pdf]

Claude's Cycles [pdf] 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 3월 4일

How do I cancel my ChatGPT subscription?

How do I cancel my ChatGPT subscription? 소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 3월 3일

We do not think Anthropic should be designated as a supply chain risk

소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 3월 2일

OpenAI – How to delete your account

OpenAI – How to delete your account 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 3월 1일

OpenAI agrees with Dept. of War to deploy models in their classified network

소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 2월 28일

How will OpenAI compete?

OpenAI에는 몇 가지 큰 질문이 있습니다. 독특한 기술은 없습니다. 사용자 기반은 크지만 참여도와 끈기가 제한적이고 네트워크 효과가 없습니다. 기존 기업은 기술과 일치하며 제품과 유통을 활용하고 있습니다. 그리고 많은 가치와 영향력은 새로운 경험에서 나올 것입니다.

트렌드
AI
읽기
2026년 2월 27일

Google API keys weren't secrets, but then Gemini changed the rules

Google은 개발자들에게 Google API 키(예: 지도, Firebase 등에 사용되는 키)가 비밀이 아니라는 사실을 알리는 데 10년 넘게 시간을 보냈습니다. 그러나 그것은 더 이상 사실이 아닙니다.

트렌드
AI
읽기
2026년 2월 26일

Claude Code Remote Control

원격 제어를 사용하여 휴대폰, 태블릿 또는 브라우저에서 로컬 Claude Code 세션을 계속하세요. clude.ai/code 및 Claude 모바일 앱과 함께 작동합니다.

트렌드
AI
읽기
2026년 2월 25일

“Car Wash” test with 53 models

신뢰할 수 있는 에이전트를 위한 개발자 플랫폼

트렌드
AI
읽기
2026년 2월 25일

Discord cuts ties with Peter Thiel–backed verification software after its code was found tied to U.S. surveillance efforts

Discord는 유출된 코드가 70,000명의 사용자를 덮친 지 몇 달 만에 연방 보고에 대한 우려를 불러일으킨 후 연령 확인 파트너와의 관계를 끊었습니다.

트렌드
AI
읽기
2026년 2월 25일

Show HN: Micasa – track your house from the terminal

micasa — your house, in a terminal 소식의 핵심을 빠르게 정리하면, 개발 도구 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.

트렌드
AI
읽기
2026년 2월 25일

Why is Claude an Electron app?

코드가 무료라면 모든 앱이 기본이 아닌 이유는 무엇입니까?

트렌드
AI
읽기
2026년 2월 25일

OpenAI has deleted the word 'safely' from its mission

OpenAI의 구조 조정은 사회가 인류에게 이익을 제공하고 해를 끼칠 가능성이 있는 조직의 업무를 어떻게 감독하는지에 대한 테스트 사례가 될 수 있습니다.

트렌드
AI
읽기
2026년 2월 24일

Anthropic officially bans using subscription auth for third party use

Legal agreements, compliance certifications, and security information for Claude Code.

트렌드
AI
읽기
2026년 2월 24일

How I use Claude Code: Separation of planning and execution

The research-plan-implement workflow I use to build software with Claude Code, and why I never let it write code until I've approved a written plan. (카테고리: 트렌드, HN 947점·댓글 580)

트렌드
AI
읽기
2026년 2월 23일

Gemini 3.1 Pro

3.1 Pro is designed for tasks where a simple answer isn’t enough. (카테고리: AI 모델, HN 961점·댓글 910)

트렌드
AI
읽기
2026년 2월 23일

Claude Sonnet 4.6

Claude Sonnet 4.6 is a full upgrade of the model’s skills across coding, computer use, long-reasoning, agent planning, knowledge work, and design. (카테고리: AI 모델, HN 1345점·댓글 1223)

트렌드
AI
읽기
2026년 2월 23일

Gemini 3 Deep Think

We’re releasing a major upgrade to Gemini 3 Deep Think, our specialized reasoning mode. (카테고리: AI 모델, HN 1080점·댓글 693)

트렌드
AI
읽기
읽을거리로 돌아가기