아카이브
최신 글을 차례대로 훑기 쉽게 정리했습니다. 제목, 날짜, 짧은 설명부터 읽고 필요할 때만 태그나 카테고리로 더 좁혀볼 수 있습니다.
현재 보기
273개 글 · #AI / 2026
GitHub는 2026년 6월 1일부터 모든 Copilot 플랜을 premium request 기반에서 GitHub AI Credits 기반 사용량 과금으로 전환한다고 발표했다. 과금 단위는 요청 수가 아니라 input·output·cached token 사용량이며, 조직은 pooled credits와 budget controls로 초과 사용을 제어할 수 있다. 🔍 왜 주목해야 하나 이…
Microsoft는 2026년 4월 27일 Azure Local 기반 Sovereign Private Cloud가 단일 sovereign environment 안에서 수천 대 서버 규모까지 확장된다고 발표했다. 검증된 compute/storage 파트너 스택과 Intel Xeon 6의 AMX AI acceleration을 결합해, 데이터·모델·실행을 고객 관할 경계 안에 둔 채 대규모 AI…
NVIDIA는 2026년 4월 28일 vision·audio·video·text를 한 모델에서 처리하는 오픈 multimodal reasoning model Nemotron 3 Nano Omni를 발표했다. 이 모델은 30B-A3B hybrid MoE, 256K context를 기반으로 document intelligence·video/audio understanding…
IBM은 2026년 4월 28일 enterprise용 AI development partner IBM Bob을 공개했다. Bob은 코드 생성에 그치지 않고 planning·coding·testing·deployment·modernization 전반을 다루며, task별로 Claude·Mistral·Granite 등 여러 모델을 비용·정확도 기준으로 자동 라우팅한다. 🔍 왜 주목해야 하나…
Snowflake는 2026년 4월 21일 Snowflake Intelligence와 Cortex Code 업데이트를 발표하며, enterprise AI의 control plane 포지션을 강화했다. Cortex Code는 AWS Glue·Databricks·Postgres 지원 확대, MCP/ACP 연동, VS Code extension과 Claude Code plugin,…
Cloudflare는 2026년 4월 20일 자사 내부 AI engineering stack을 공개하며, 최근 30일 기준 R&D 조직의 93%가 사내 AI 코딩 도구를 사용했고 AI Gateway를 통해 241.37B tokens, Workers AI에서 51.47B input tokens를 처리했다고 밝혔다. 다음 단계로는 MCP portal, git, test runner를 그대로…
Warp는 2026년 4월 28일 Warp client를 AGPL로 오픈소스화하고, Oz 기반 agent-first 기여 워크플로를 공개했다. 동시에 Kimi·MiniMax·Qwen 지원 확대, auto (open) 모델 라우팅, 설정 파일 추가로 IDE/ADE를 더 개방형 표면으로 재구성했다. 🔍 왜 주목해야 하나 이 발표의 핵심은 오픈소스화 자체보다도 "agent가 구현을 맡고,…
Anthropic은 2026년 4월 23일 Claude Code 품질 저하 보고에 대한 사후분석을 공개했다. 원인은 모델 열화가 아니라 제품 레이어의 세 가지 변경으로, 기본 reasoning effort를 high에서 medium으로 낮춘 결정, 1시간 이상 idle 세션에서 thinking history를 반복 삭제한 캐시 버그, 그리고 4월 16일 도입했다가 4월 20일 되돌린…
Google은 2026년 4월 15일 Google AI Studio용 Gemini API Prepay Billing을 발표했다. 신규 Google Cloud Billing Account를 여는 미국 사용자부터 선불 크레딧 기반 결제를 쓸 수 있고, 자동 충전과 함께 남은 잔액을 기준으로 API 호출 비용을 관리하게 해 spend predictability를 높이겠다는 내용이다. 🔍 왜…
Qwen 팀은 2026년 4월 Qwen3.6 시리즈를 공개하며 35B-A3B와 27B 모델을 순차 배포했다. 공식 저장소 기준으로 이번 릴리스는 agentic coding, front-end workflow, repository-level reasoning 강화와 함께 conversation history 전반에 thinking context를 유지하는 Thinking…
OpenAI는 2026년 4월 29일 Stargate를 통해 2029년 목표였던 미국 내 10GW AI infrastructure 확보를 이미 넘어섰고, 최근 90일에만 3GW 이상을 추가했다고 밝혔다. 또한 GPT-5.5가 Texas Abilene의 Oracle Cloud Infrastructure와 NVIDIA GB200 systems 위에서 학습됐다고 공개했다. 🔍 왜 주목해야 하나…
Vercel은 2026년 4월 28일 Native Deployment Checks를 공개했다. 팀은 이제 각 deployment마다 package.json의 lint와 typecheck 스크립트를 build와 병렬로 실행할 수 있고, check를 required로 지정해 production 진입을 막을 수 있으며, 실패 시 Vercel Agent가 원인 분석과 수정 제안을 제공한다. 🔍…
Parallel Web Systems는 2026년 4월 29일 Sequoia 주도로 1억 달러 Series B를 유치하며 기업가치 20억 달러를 기록했다고 발표했다. 회사는 AI agents가 open web를 검색·추출·모니터링할 수 있도록 하는 infrastructure layer를 제공하며, 총 누적 투자금은 2억3000만 달러로 늘었다. 🔍 왜 주목해야 하나 이 라운드가 의미하는…
OpenAI는 2026년 4월 27일 Symphony를 공개했다. Symphony는 Linear 같은 이슈 트래커를 coding agents의 control plane으로 삼는 오픈소스 orchestration spec이며, 각 티켓을 격리된 workspace와 장기 실행 세션에 매핑해 자동 재시도·상태 추적·handoff를 관리한다. 🔍 왜 주목해야 하나 이 발표가 중요한 이유는 코딩…
OpenAI는 2026년 4월 22일 ChatGPT용 workspace agents를 발표했다. Codex 기반으로 동작하는 이 agents는 공유된 조직 맥락과 권한 체계 안에서 보고서 작성, 코드 생성, 메시지 응답, Slack 연동, 일정 기반 실행 같은 장기 워크플로를 수행하며, ChatGPT Business·Enterprise·Edu·Teachers 플랜에서 research…
OpenAI와 AWS는 2026년 4월 28일 전략적 파트너십 확대를 발표하며 GPT-5.5를 포함한 OpenAI models, Codex, 그리고 Amazon Bedrock Managed Agents를 AWS 환경에서 제한적 프리뷰로 제공하기 시작했다. 기업은 이제 Bedrock의 보안·ID·조달 체계 안에서 OpenAI 모델과 코딩 에이전트, multi-step agent…
Anthropic은 2026년 4월 24일 NEC와의 전략적 협업을 발표하며 Claude를 약 3만 명의 NEC Group 직원에게 배포하고, 일본 시장용 산업 특화 AI 제품을 공동 개발한다고 밝혔다. 협업 범위에는 Claude Opus 4.7, Claude Code, Claude Cowork, NEC BluStellar 프로그램, 그리고 finance·manufacturing·local…
OpenAI는 2026년 4월 27일 ChatGPT Enterprise와 API Platform이 FedRAMP 20x Moderate authorization을 획득했다고 발표했다. 이에 따라 미국 연방기관은 보안·프라이버시·거버넌스 요구사항을 충족하는 환경에서 GPT-5.5를 포함한 OpenAI 관리형 제품을 활용할 수 있고, 향후 FedRAMP 환경에서 Codex Cloud 접근도…
OpenAI는 2026년 4월 27일 Microsoft와의 파트너십 개정안을 발표했다. 핵심 변경점은 OpenAI 제품의 멀티클라우드 판매 허용, Microsoft의 2032년까지 비독점 IP 라이선스 유지, Microsoft의 OpenAI 매출분배 종료, 그리고 2030년까지 capped revenue-share 구조 유지다. 🔍 왜 주목해야 하나 이 발표의 본질은 frontier AI…
NVIDIA가 공개한 한국어 합성 페르소나 데이터셋으로, 한국의 공개 통계와 지역·직업·교육 등 사회적 분포를 바탕으로 100만 개 규모의 페르소나 레코드를 구성한 자료다. 한국어 모델 학습과 시뮬레이션에서 한국형 맥락을 반영하는 데 참고할 수 있다. 소버린 AI, 한국어 LLM 학습, 합성 데이터 다양성 확대 관점에서 볼 만하다. 영어권 중심 페르소나 데이터셋으로는 놓치기 쉬운 지역성과…
DeepSeek는 2026년 4월 24일 V4 Preview를 공개했다. V4 Pro는 1.6T total / 49B active parameters, V4 Flash는 284B total / 13B active parameters를 갖고 두 모델 모두 1M token context를 지원하며, Flash는 입력 토큰 100만 개당 0.14달러로 제시됐다. 🔍 왜 주목해야 하나 이 발표의…
GitHub는 2026년 4월 16일 GitHub CLI용 gh skill을 공개했다. 이 명령은 agent skills를 검색·설치·업데이트·배포할 수 있게 하며, Claude Code, Codex, Cursor, Copilot, Gemini CLI 등 여러 agent host를 지원하고, tag pinning·tree SHA 기록·immutable releases 권장으로 공급망…
Mistral AI는 최근 Mistral 3를 공개하며 675B total / 41B active의 Mistral Large 3와 3B·8B·14B 규모의 Ministral 3 시리즈를 함께 내놨다. 전 모델을 Apache 2.0으로 공개하고, Large 3는 8×A100 또는 8×H100 단일 노드 배포 경로, 소형 모델은 edge·robotics 환경까지 겨냥하며 배포 범위를 넓혔다.…
OpenAI는 2026년 4월 22일 미국의 검증된 physician, NP, PA, pharmacist에게 무료로 제공되는 ChatGPT for Clinicians를 공개했다. 이 제품은 trusted clinical search, cited deep research, reusable skills, CME 연동을 포함하며, OpenAI는 700,000건 이상의 health response…
GitHub는 2026년 4월 20일 Copilot Individual 요금제 조정을 발표하며 신규 Pro, Pro+, Student 가입을 일시 중단하고, usage limit를 강화하고, Opus 계열 모델의 Pro 제공을 중단한다고 밝혔다. GitHub는 agentic workflow의 병렬·장기 세션이 원래 요금제 구조보다 훨씬 높은 compute cost를 발생시키고 있으며,…
OpenAI는 2026년 4월 16일 biology, drug discovery, translational medicine 연구용 모델인 GPT-Rosalind를 research preview로 공개했다. 이 모델은 ChatGPT, Codex, API에서 qualified customer 대상으로 제공되며, LABBench2의 11개 과제 중 6개에서 GPT-5.4를 앞섰고, Codex 앱…
OpenAI는 2026년 4월 23일 GPT-5.5를 공개했고, 4월 24일에는 API 제공까지 시작했다. GPT-5.5는 Terminal-Bench 2.0에서 82.7%, SWE-Bench Pro에서 58.6%, GDPval에서 84.9%, OSWorld-Verified에서 78.7%를 기록하며 GPT-5.4 대비 더 높은 성능과 더 낮은 토큰 사용량을 동시에 내세웠다. 🔍 왜 주목해야…
Anthropic은 가격 페이지를 기준으로 월 20달러 프로 구독에서 Claude Code를 제거한 것으로 보입니다. 누가 20달러 계획을 갖고 있는지 확인할 수 있는 사람이 있나요? clude.com/pricing
ChatGPT Images 2.0 소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
Google은 2026년 4월 22일 Cloud Next '26에서 Gemini Enterprise Agent Platform과 8세대 TPU 8t·8i를 공개했다. Agent Platform은 Vertex AI를 사실상 agent 전용 control plane으로 재편하며, Google은 고객 API 트래픽이 분기당 100억 토큰/분에서 160억 토큰/분으로 늘었고 ADK를 통한…
Meta는 2026년 4월 14일 Broadcom과 차세대 MTIA(Meta Training and Inference Accelerator) 칩을 다세대 공동개발한다고 발표했다. Meta는 향후 2년 내 MTIA 4세대를 개발·배치하고, 1GW를 넘는 초기 배치를 시작으로 장기적으로 multi-gigawatt 규모의 custom silicon 인프라를 확대하겠다고 밝혔다. 🔍 왜 주목해야…
OpenAI는 2026년 4월 22일 PII 탐지·마스킹용 open-weight 모델인 Privacy Filter를 공개했다. 이 모델은 최대 128K 컨텍스트를 지원하는 1.5B 파라미터급 token-classification 모델로, PII-Masking-300k 기준 96% F1과 수정 평가셋 기준 97.43% F1을 제시하며 Apache 2.0 라이선스로 Hugging Face와…
Microsoft는 2026년 4월 2일 Agent Governance Toolkit을 MIT 라이선스로 공개했다. 이 오픈소스 프로젝트는 OWASP Agentic AI Top 10의 10개 위험군을 모두 다루는 runtime governance stack을 목표로 하며, Agent OS·Mesh·Runtime·SRE·Compliance·Marketplace·Lightning의 7개…
Anthropic은 2026년 4월 20일 Amazon과 협력을 확대해 Claude 학습·서빙용으로 최대 5GW 규모의 신규 컴퓨트 용량을 확보한다고 발표했다. Anthropic은 향후 10년간 AWS 기술에 1,000억 달러 이상을 투입하고, 2026년 말까지 Trainium2·Trainium3 기반으로 총 1GW에 가까운 용량이 순차적으로 가동될 예정이며, Claude Platform…
Google DeepMind는 2026년 4월 21일 Gemini API용 Deep Research와 Deep Research Max를 공개했다. Gemini 3.1 Pro 기반으로 웹 검색, remote MCP, 파일 업로드, 연결 스토리지를 함께 탐색할 수 있고, Deep Research Max는 extended test-time compute를 사용해 더 깊은 조사와 합성을 수행한다.…
Microsoft는 2026년 4월 9일 Power Platform 4월 업데이트에서 Canvas Apps MCP Authoring Plugin과 generative pages용 external tool 지원 확대를 발표했다. 사용자는 GitHub Copilot, Claude Code 등 MCP 호환 AI coding agent를 live Power Apps Studio 세션에 연결해…
OpenAI는 2026년 4월 2일 Technology Business Programming Network(TBPN)를 인수했다고 발표했다. TBPN은 OpenAI Strategy 조직 산하로 들어가지만, OpenAI는 프로그램 운영과 게스트 선정 등 편집 독립성은 유지된다고 밝혔다. 🔍 왜 주목해야 하나 이 뉴스의 본질은 frontier AI 기업의 경쟁 단위가 모델 성능과 API…
GitHub는 2026년 4월 13일 copilot --remote를 공개하며 Copilot CLI 세션을 웹과 GitHub Mobile에서 원격으로 모니터링하고 조종할 수 있는 기능을 public preview로 출시했다. 사용자는 다른 디바이스에서 실행 중인 세션의 활동을 보고, 중간 지시를 보내고, plan·interactive·autopilot 모드를 전환하며, 권한 요청 승인과…
Vercel은 2026년 4월 20일 업데이트한 보안 공지에서, 내부 시스템 일부에 대한 무단 접근이 있었고 그 출발점이 직원이 사용하던 third-party AI 도구 Context.ai의 침해였다고 밝혔다. 공격자는 이 경로를 통해 Vercel Google Workspace 계정을 탈취했고, 민감(sensitive)으로 표시되지 않은 일부 환경변수에 접근한 것으로 조사됐다. 🔍 왜…
Vercel은 2026년 4월 16일 Vercel Flags를 정식 출시했다고 발표했다. 이 기능은 Vercel Dashboard에서 targeting rules, user segments, environment controls를 관리하고, Next.js·SvelteKit용 Flags SDK와 OpenFeature 호환 어댑터를 통해 애플리케이션 코드에 바로 연결된다. 🔍 왜 주목해야…
Molotov cocktail is hurled at home of Sam Altman 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
Ollama는 최초의 간편한 llama.cpp 래퍼로 인기를 얻었고, 다른 사람의 엔진에서 벌어들인 VC 자금을 활용하면서 속성을 피하고, 사용자를 오도하고, 클라우드로 전환하는 데 수년을 보냈습니다. 전체 기록과 대안이 더 나은 이유는 다음과 같습니다.
Voicebox는 음성 복제, 다국어 TTS, 후처리 효과, 멀티 보이스 편집을 한곳에서 다루는 로컬 우선 음성 합성 스튜디오다. 클라우드형 음성 서비스의 대안으로 제시되며, 여러 TTS 엔진을 바꿔가며 테스트하고 REST API로 앱에 붙일 수 있게 설계됐다. 볼 만한 이유는 단순한 모델 데모가 아니라 실제 제작 워크플로우에 가까운 구조를 갖췄기 때문이다. 몇 초짜리 샘플로 보이스…
TechCrunch는 2026년 4월 4일 Anthropic이 Claude Code 구독자가 OpenClaw 같은 third-party harness를 사용할 경우 더 이상 기존 구독 한도를 쓸 수 없고, 별도 pay-as-you-go 과금이 적용된다고 보도했다. Anthropic은 이 정책이 OpenClaw부터 시작하지만 다른 third-party harness 전반으로 확대될 것이라고…
Google은 2026년 4월 15일 Gemini 3.1 Flash TTS를 발표하고 Gemini API, Google AI Studio, Vertex AI, Google Vids에 preview로 배포하기 시작했다. 이 모델은 70개 이상 언어를 지원하고, Artificial Analysis TTS leaderboard에서 Elo 1,211을 기록했으며, natural-language…
Google DeepMind는 2026년 4월 14일 Gemini Robotics-ER 1.6을 공개하고 Gemini API와 Google AI Studio에서 즉시 사용할 수 있게 했다. 새 버전은 spatial reasoning, multi-view success detection, instrument reading을 강화했고, instrument reading 정확도는 agentic…
문서에서는 토큰이 1.0~1.35배 더 많다고 밝혔습니다. 실제 콘텐츠에서는 1.47x를 측정했습니다.
GitHub는 2026년 4월 15일 Copilot cloud agent를 enterprise 전체가 아니라 특정 조직 단위로 선택적으로 활성화할 수 있는 기능을 추가했다. 관리자는 custom properties 또는 새 API endpoint를 이용해 selected organizations만 CCA를 허용할 수 있다. 🔍 왜 주목해야 하나 이 변화가 중요한 이유는 에이전트 도입의…
Meta는 2026년 4월 8일 Meta Superintelligence Labs의 첫 모델인 Muse Spark를 공개했다. 이 모델은 현재 Meta AI 앱과 웹을 구동하며, 향후 WhatsApp·Instagram·Facebook·Messenger·AI glasses로 확장되고, select partners 대상 private preview API도 제공될 예정이다. 🔍 왜 주목해야…
GitHub는 2026년 4월 14일 github.com의 Claude·Codex third-party coding agent에 model selection을 추가했다. Claude 쪽은 Sonnet 4.6·Opus 4.6·Sonnet 4.5·Opus 4.5를, Codex 쪽은 GPT-5.2-Codex·GPT-5.3-Codex·GPT-5.4를 작업 시작 시 직접 고를 수 있다. 🔍 왜…
Reuters는 2026년 4월 10일 중국 AI 스타트업 ShengShu Technology가 Alibaba Cloud 주도의 라운드에서 20억 위안, 약 2억9259만 달러를 조달했다고 보도했다. 회사는 이 자금을 sensory information을 처리해 인간 지각과 상호작용을 모사하는 'general world model' 개발에 투입할 계획이라고 밝혔다. 🔍 왜 주목해야 하나…
Codex for almost everything 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
오늘 우리는 Claude와 협력하여 디자인, 프로토타입, 슬라이드, 단일 페이지 등과 같은 세련된 시각적 작업을 만들 수 있는 새로운 Anthropic Labs 제품인 Claude Design을 출시합니다.
Linux Foundation은 2026년 4월 9일 A2A Protocol이 1년 만에 150개 이상 조직의 지지를 확보했고, Google·Microsoft·AWS 플랫폼에 통합되며 production-ready open standard로 자리 잡았다고 발표했다. A2A 1.0은 multi-protocol support, multi-tenancy, modernized security…
GitHub는 2026년 4월 13일 Copilot에 US·EU 데이터 레지던시와 미국 공공부문용 FedRAMP Moderate 준수 구성을 추가했다. agent mode, chat, code review, pull request summary, Copilot CLI를 포함한 일반 제공 기능이 지정 지역 내 inference endpoint만 사용하며, 해당 요청에는 기본 대비 10%의…
GitHub는 2026년 4월 16일 GitHub CLI v2.90.0 이상에서 사용할 수 있는 gh skill을 공개했다. 이 명령은 Agent Skills specification을 따르는 스킬을 검색, 설치, 업데이트, 게시할 수 있게 하며, Claude Code, Codex, Cursor, Gemini CLI 등 여러 agent host를 한 번에 겨냥한다. 🔍 왜 주목해야 하나…
Mistral은 2026년 4월 16일 Mistral Small 4를 발표했다. 이 모델은 119B total parameters, 6B active parameters의 128-expert MoE 구조와 256k context window를 갖고, reasoning·multimodal·agentic coding을 하나로 묶은 Apache 2.0 오픈 모델로 제공된다. 🔍 왜 주목해야…
Anthropic은 신뢰할 수 있고 해석 가능하며 조종 가능한 AI 시스템을 구축하기 위해 노력하는 AI 안전 및 연구 회사입니다.
Google은 2026년 4월 15일 Gemini CLI에 subagents를 도입했다. 각 subagent는 별도 context window, system instructions, tool set, MCP servers를 가지며, @agent 문법과 Markdown 기반 정의 파일로 명시 호출하거나 자동 라우팅할 수 있다. 🔍 왜 주목해야 하나 이번 발표의 본질은 CLI 에이전트가 단일…
Google은 2026년 4월 14일 AI Agent Bake-Off에서 얻은 5가지 개발 원칙을 공개했다. 글은 production-grade agent를 위해 multi-agent architecture, state management, deterministic guardrails, open protocols(MCP 등)를 핵심 원칙으로 제시했다. 🔍 왜 주목해야 하나 이 글이 중요한…
Mistral AI는 2026년 4월 7일 'European AI: a playbook to own it'을 발표하며 유럽 AI 전략을 위한 실행 프레임을 제안했다. 문서는 4년짜리 EU AI Blue Card, 단일 규제 포털, 유럽 우선 공공조달, AI 인프라 선호 정책 등 인재·자본·조달·컴퓨트 전반의 구체 조치를 담고 있다. 🔍 왜 주목해야 하나 이 문서의 핵심은 AI 경쟁을 기업…
OpenAI는 2026년 4월 15일 Agents SDK를 개편하며 model-native harness, native sandbox execution, Manifest 기반 워크스페이스 추상화, harness/compute 분리 구조를 공개했다. 새 기능은 API 고객에게 일반 제공되며 표준 API 과금으로 사용된다. 🔍 왜 주목해야 하나 핵심은 에이전트 경쟁의 단위가 더 이상 모델…
Reddit - Please wait for verification 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
GitHub는 2026년 4월 8일 VS Code용 Copilot March releases를 공개하며 Autopilot preview, integrated browser debugging, nested subagents, sandbox MCP servers, semantic-only #codebase search를 한 번에 묶어 발표했다. 이번 업데이트는 에이전트가 IDE 안에서 계획,…
Hugging Face는 2026년 봄 오픈소스 AI 리포트를 통해 2025년 신규 trending model의 다수가 China에서 개발되었거나 China-origin 모델 파생형이었고, Alibaba의 Qwen 계열은 11만 3천 개 이상의 derivative models를 만들었다고 정리했다. 또 1-9B급 모델의 상위군은 100B+ 모델 대비 median 기준 약 4배 높은…
Parasail은 2026년 4월 15일 3,200만 달러 Series A를 유치했고, 회사 측은 현재 하루 5,000억 토큰 규모의 inference를 처리한다고 밝혔다. 이 회사는 자체 GPU 일부를 보유하지만 핵심 전략은 15개국 40개 데이터센터의 연산 용량과 secondary liquidity market을 묶어 inference 워크로드를 오케스트레이션하는 데 있다. 🔍 왜…
클로드 코드를 자동 조종 장치로 설정하세요. 일정에 따라 실행되거나, API 호출에 대해 트리거되거나, Anthropic이 관리하는 클라우드 인프라의 GitHub 이벤트에 반응하는 루틴을 정의하세요.
코드(25개 언어), 문서, 논문, 이미지, 비디오 등 다양한 파일을 분석해 쿼리 가능한 지식 그래프로 변환하는 AI 어시스턴트 스킬. Tree-sitter AST로 코드 구조를 추출하고, Claude Vision으로 이미지를 분석하며, faster-whisper로 영상/오디오를 로컬 변환한다. 원본 대비 71.5배 토큰 감소. GitHub 스타 26.6k. 🔍 왜 주목해야 하나 AI…
Anthropic은 2026년 4월 6일 Google·Broadcom과 2027년부터 가동될 multiple gigawatts 규모의 차세대 TPU 용량 계약을 체결했다고 밝혔다. 회사는 연환산 매출이 2025년 말 약 90억 달러에서 2026년 현재 300억 달러를 넘었고, 연간 100만 달러 이상을 쓰는 기업 고객도 500개에서 1,000개 이상으로 두 달 만에 두 배로 늘었다고…
Google은 2026년 3월 31일 Agent Development Kit for Go 1.0을 공개하며 OpenTelemetry tracing, Plugin System, Human-in-the-Loop confirmation, YAML 기반 agent 정의, A2A 프로토콜 안정화를 핵심 업데이트로 제시했다. 공식 블로그는 이 릴리즈가 step-by-step·concurrent…
OpenAI는 2026년 4월 9일 ChatGPT release notes를 통해 GPT-5.3 Instant Mini를 GPT-5.3 Instant 한도 초과 시 쓰이는 fallback 모델로 교체하고, 월 100달러의 새 Pro 요금제를 도입했다고 밝혔다. 새 Pro는 GPT-5.4 무제한 사용과 GPT-5.4 Pro 접근, 한시적으로 Plus 대비 최대 10배의 Codex 사용량을…
Anthropic은 2026년 4월 7일 Project Glasswing를 발표하며 AWS, Apple, Cisco, Google, Microsoft, NVIDIA, Palo Alto Networks 등과 함께 critical software 보안을 강화하는 연합 프로그램을 시작했다. Anthropic은 Claude Mythos Preview가 이미 모든 주요 OS와 웹 브라우저를 포함한…
Open Agents는 Vercel 위에서 백그라운드 코딩 에이전트를 만들고 실행하기 위한 오픈소스 레퍼런스 앱이다. 웹 UI, 에이전트 런타임, 샌드박스 오케스트레이션, GitHub 연동까지 함께 제공해 프롬프트에서 실제 코드 변경과 저장소 작업으로 이어지는 흐름을 한 저장소 안에서 보여준다. 이 링크가 볼 만한 이유는 에이전트와 샌드박스를 분리한 구조를 비교적 선명하게 드러내기…
Apple Silicon용 Gemma 4 26B 기반 MLX 4-bit 모델 카드. 텍스트 중심 로컬 에이전트 작업을 겨냥한 빠른 추론형 변형으로 소개된다.
colleague.skill은 특정 동료의 업무 방식과 표현 톤을 스킬 형태로 정리해 재사용할 수 있게 만드는 오픈소스 프로젝트다. /create-colleague 명령으로 새 스킬을 만들고, 생성된 페르소나를 /{slug} 형태로 호출해 반복 작업에 적용한다. 프롬프트를 매번 복붙하는 대신, 팀 내부의 암묵지와 일 스타일을 에이전트가 읽는 재사용 가능한 인터페이스로 바꾸려는 시도이기…
AI 코딩 도구 운영 팁 저장소
designmd.ai는 AI 코딩 도구가 읽을 수 있는 DESIGN.md 포맷 기반 디자인 시스템을 모아 검색·공유하는 레지스트리다. 100개 이상의 무료 디자인 시스템을 탐색하고 포맷 문서, MCP, CLI 문맥까지 함께 볼 수 있게 구성돼 있다. 프롬프트와 이미지 레퍼런스에 흩어져 있던 디자인 컨텍스트를 Markdown 명세로 묶어, AI가 더 일관되게 UI를 생성하도록 돕는 흐름을…
TypeUI는 AI가 생성한 UI 코드 위에 일관된 시각 규칙을 덧입히기 위한 CLI이자 디자인 스킬 레지스트리다. pull·generate·update 흐름으로 스킬을 프로젝트에 주입하고, 무료 스킬과 상용 기능을 함께 제공한다. AI 코딩의 문제를 단순히 더 많이 생성하는 것이 아니라, 여러 에이전트와 작업자가 섞여도 같은 시각 언어를 유지하게 만드는 데 초점을 둔 도구라는 점이…
JetBrains Research는 2026년 4월 공개한 조사에서 2026년 1월 기준 전 세계 개발자의 90%가 업무에서 최소 하나의 AI 도구를 정기적으로 사용하고, 74%는 specialized AI developer tools를 이미 채택했다고 밝혔다. GitHub Copilot은 여전히 가장 널리 알려진 도구지만, Claude Code는 업무 사용률 18%로 빠르게 성장했고…
JetBrains는 2026년 4월 14일 Junie CLI가 실행 중인 JetBrains IDE에 직접 연결되어 indexing, semantic analysis, 기존 build/test configuration을 그대로 활용할 수 있다고 발표했다. 별도 수동 설정 없이 실행 중인 IDE를 자동 감지하며, monorepo나 복잡한 테스트 구성에서도 IDE의 설정을 기반으로 동작한다.…
OpenAI는 2026년 3월 31일 1220억 달러의 신규 자금 조달을 마감했고, post-money valuation은 8520억 달러라고 밝혔다. 회사는 이 자금을 연구, 제품, 접근성 확대뿐 아니라 durable compute access 확보와 delivery cost 구조 개선에 투입하겠다고 설명했다. 🔍 왜 주목해야 하나 이 발표의 핵심은 단순한 대규모 자금 조달이 아니라,…
OpenAI는 2026년 4월 8일 CRO Denise Dresser 명의로 enterprise AI 전략을 공개하며, enterprise가 이미 전체 매출의 40% 이상을 차지하고 2026년 말 consumer와 parity에 이를 것이라고 밝혔다. 같은 글에서 Codex의 주간 활성 사용자는 300만 명, API 처리량은 분당 150억 토큰 이상이라고 제시했다. 🔍 왜 주목해야 하나…
캐시 TTL은 2026년 3월 초경에 1시간에서 5분으로 자동 회귀하여 상당한 할당량과 비용 인플레이션을 일으킨 것으로 보입니다. 1월에 걸쳐 원시 Claude 코드 세션 JSONL 파일에 대한 요약 분석...
실행 전 체크리스트 기존 문제를 검색했지만 아직 보고되지 않았습니다. 이것은 단일 버그 보고서입니다(다른 버그에 대해서는 별도의 보고서를 제출해 주십시오). 최신 버전의 ...을 사용하고 있습니다.
Google DeepMind는 2026년 4월 2일 Gemma 4를 공개했다. 새 라인업은 E2B, E4B, 26B MoE, 31B Dense 네 가지 크기로 구성되며 Apache 2.0 라이선스로 배포되고, 31B 모델은 Arena 기준 당시 세계 오픈 모델 3위, 26B 모델은 6위라고 밝혔다. 🔍 왜 주목해야 하나 이번 발표의 본질은 Google이 Gemini 같은 폐쇄형 모델과…
Mistral AI는 2026년 4월 초 Mistral 3를 공개했다. 라인업은 14B·8B·3B의 소형 dense 모델과 41B active/675B total parameters의 Mistral Large 3로 구성되며, 전 모델을 Apache 2.0 라이선스로 공개했고 Large 3는 LMArena 기준 오픈 비추론 모델 2위라고 밝혔다. 🔍 왜 주목해야 하나 이 발표는 오픈 모델…
OpenAI는 2026년 4월 6일 OpenAI Safety Fellowship을 발표했다. 프로그램은 2026년 9월 14일부터 2027년 2월 5일까지 진행되며, 외부 연구자와 엔지니어를 대상으로 safety evaluation, robustness, privacy-preserving safety, agentic oversight, high-severity misuse 같은 분야의…
Microsoft는 2026년 4월 8일 SQL MCP Server를 공개했다. Data API builder 기반의 이 서버는 Microsoft SQL, PostgreSQL, Azure Cosmos DB, MySQL을 지원하며, RBAC·Key Vault·OpenTelemetry·REST/GraphQL/MCP 동시 노출과 함께 AI agent용 고정 DML 도구 집합을 제공한다. 🔍 왜…
ChatGPT 제작자는 AI 연구소가 책임을 질 수 있는 시기를 제한하는 일리노이주 법안에 찬성하여 증언했습니다. AI 연구소의 제품이 "심각한 피해"를 초래하는 경우에도 마찬가지입니다.
Microsoft는 2026년 3월 18일 Azure Developer CLI의 azure.ai.agents 확장에 azd ai agent run과 azd ai agent invoke를 추가했다. 로컬 머신에서 에이전트를 직접 실행하고, 원격 Foundry endpoint 또는 --local 대상에 메시지를 보내며, multi-turn session을 유지할 수 있다. 🔍 왜 주목해야…
Microsoft는 2026년 4월 10일 Azure MCP Server 2.0 stable을 발표했다. 이번 릴리즈는 57개 Azure 서비스에 걸친 276개 MCP tools를 제공하며, 핵심 변화로 self-hosted remote MCP server, managed identity·OBO 기반 인증, 보안 강화, sovereign cloud 대응을 내세웠다. 🔍 왜 주목해야 하나…
Anthropic은 2026년 4월 9일 Claude Cowork를 macOS·Windows용 Claude Desktop에서 generally available로 전환했다. 이번 GA에는 Analytics API 연동, 팀/엔터프라이즈용 사용량 분석, OpenTelemetry 지원, 그룹 기반 RBAC가 함께 포함됐다. 🔍 왜 주목해야 하나 핵심은 Cowork가 더 이상 개인 생산성…
Microsoft는 2026년 4월 1일 Dataverse Skills를 공개했다. GitHub Copilot과 Claude Code용 오픈소스 플러그인으로, Dataverse 환경 탐색, PAC CLI 인증, MCP 등록, 스키마 설계, 데이터 적재, 분석 질의를 자연어 기반 에이전트 루프로 묶는다. 🔍 왜 주목해야 하나 이 발표의 본질은 로우코드 플랫폼도 이제 사람 UI가 아니라…
Claude는 때때로 자신에게 메시지를 보내고 그 메시지가 사용자로부터 온 것이라고 생각합니다. 이는 환각이나 권한 상실과는 명백히 다릅니다.
GitHub는 2026년 4월 9일 secret risk assessment와 Code Security risk assessment 결과 화면에서 바로 Copilot을 호출할 수 있는 기능을 추가했다. 이제 조직 관리자와 security manager는 위험 평가 결과에서 컨텍스트 설명과 다음 단계 가이드를 Copilot 경험 안에서 즉시 받을 수 있다. 🔍 왜 주목해야 하나 이 변화는…
GitHub는 2026년 4월 2일 Copilot SDK를 public preview로 공개했다. 이 SDK는 Copilot cloud agent와 Copilot CLI가 쓰는 동일한 agent runtime을 Node.js/TypeScript, Python, Go, .NET, Java에서 직접 임베드할 수 있게 하며, tool invocation, streaming, file…
GitHub는 2026년 4월 6일 Copilot usage metrics에 code review 활성 사용자 신호를 세분화했다. 조직/엔터프라이즈 관리자는 이제 used_copilot_code_review_active와 used_copilot_code_review_passive를 통해 사용자가 Copilot code review를 의도적으로 활용했는지, 아니면 repo policy에 의해…
Crunchbase는 2026년 3월 25일 기준 OpenAI가 2026년에만 6건의 인수 거래를 진행해 2025년 전체 인수 건수에 근접했다고 분석했다. 최근 사례로는 오픈소스 개발자 도구 업체 Astral과 AI app testing 도구 Promptfoo가 포함됐으며, 3년 누적 인수는 17건으로 집계됐다. 🔍 왜 주목해야 하나 이 데이터가 보여주는 핵심은 OpenAI가 모델 회사에…
this is how an AI generated cow looked 12 years ago 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
GitHub는 2026년 4월 8일 GitHub Copilot in Visual Studio Code, March Releases를 공개하며 VS Code v1.111~v1.115 기간의 주요 변화를 정리했다. 핵심은 Autopilot 공개 프리뷰, 세션별 agent permissions, integrated browser debugging, chat 내 image/video 입력,…
GitHub는 2026년 4월 8일 GitHub Mobile에서 Copilot cloud agent가 pull request 이후가 아니라 그 이전 단계의 research → implementation plan → branch code changes까지 수행하도록 확장했다고 발표했다. 사용자는 모바일에서 diff를 검토하고, 반복 수정하고, 준비가 됐을 때만 PR을 생성할 수 있다. 🔍…
Meta는 2026년 3월 31일 AI를 자사 Risk Review 프로그램의 핵심에 통합했다고 밝혔다. 이 시스템은 제품 제안 단계에서 관련 법적 요구사항을 표면화하고, 문서를 prefill하며, 개발 중 잠재적 privacy·safety·security 이슈와 코드 갭을 조기에 탐지해 전문가 검토를 보조한다. 🔍 왜 주목해야 하나 이 발표는 AI를 사용자 기능이 아니라 내부 거버넌스…
Meta는 2026년 4월 8일 Meta Superintelligence Labs의 첫 모델 Muse Spark를 공개했다. 이 모델은 Meta AI 앱과 meta.ai를 즉시 구동하며, Instant/Thinking 모드, 병렬 subagent 실행, multimodal perception, visual coding, 향후 Instagram·Facebook·Threads 콘텐츠 인용…
GLM-5.1: Towards Long-Horizon Tasks 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
Cursor는 2026년 4월 6일 warp decode를 공개하며, Blackwell GPU에서 Mixture-of-Experts(MoE) decode 경로의 병렬화 축을 expert 중심에서 output 중심으로 뒤집어 1.84x throughput 향상과 FP32 기준 1.4x 더 높은 정확도를 얻었다고 밝혔다. 기존 expert-centric 경로의 8단계 중 5단계를 제거하고,…
GitHub는 2026년 4월 7일 Dynatrace와의 연동을 통해 GitHub Advanced Security에서 runtime context를 사용해 code scanning·Dependabot alert 우선순위를 정할 수 있다고 발표했다. Kubernetes 환경에서 Dynatrace가 배포된 container image와 저장소를 매핑하면, has:deployment나…
GitHub는 2026년 4월 7일 Copilot CLI가 BYOK(Bring Your Own Key)와 fully local model 실행을 지원한다고 발표했다. 이제 Azure OpenAI, Anthropic, OpenAI-compatible endpoint는 물론 Ollama, vLLM, Foundry Local 같은 로컬 모델을 붙일 수 있고, COPILOT_OFFLINE=true…
OpenAI는 2026년 4월 6일 Industrial Policy for the Intelligence Age를 발표하고, AI 전환기에 맞춘 사람 중심 산업정책 아이디어를 공개했다. 문서는 자본 과세 강화, Public Wealth Fund, 32시간/4일제 파일럿, 자동화 노동 관련 과세, 전력망 확충과 데이터센터 비용 부담 원칙까지 포함하며, OpenAI는 최대 10만 달러 연구비와…
작은 물고기처럼 말하는 ~9M 매개변수 LLM입니다. GitHub에 계정을 만들어 arman-bd/guppylm 개발에 기여하세요.
Google Stitch의 DESIGN 문서 개념을 바탕으로, 유명 서비스의 시각 언어를 Markdown으로 정리해 AI 코딩 에이전트가 유사한 UI를 구현하도록 돕는 오픈소스 컬렉션. 공식 디자인 시스템이 아니라 공개 웹사이트를 바탕으로 추출한 비공식 레퍼런스라는 점이 핵심이다.
System Card: Claude Mythos Preview [pdf] 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
Compound engineering은 Every.to의 Kieran Klaassen이 정리한 AI 네이티브 개발 철학으로, 핵심은 Plan → Work → Review → Compound 루프를 통해 각 작업이 다음 작업을 더 쉽게 만들게 하는 것이다. 단순히 AI로 빨리 코드를 짜는 것이 아니라, 리뷰 결과·버그 원인·아키텍처 판단을 agent-readable memory로 남겨 미래…
Anthropic은 2026년 4월 6일 Google과 Broadcom과의 신규 계약을 통해 2027년부터 가동될 복수 기가와트 규모의 차세대 TPU 용량을 확보한다고 발표했다. Anthropic은 이를 자사 최대 규모의 compute commitment라고 설명하며, Claude 수요 증가와 차세대 frontier 모델 개발을 위한 인프라 확장이라고 밝혔다. 🔍 왜 주목해야 하나 이…
GitHub는 2026년 4월 7일 Dependabot alert를 AI coding agent에 직접 할당하는 기능을 공개했다. 사용자는 취약점 상세 페이지에서 Copilot, Claude, Codex 중 원하는 에이전트를 선택할 수 있고, 에이전트는 advisory와 실제 dependency 사용 맥락을 분석한 뒤 draft pull request를 열고 테스트 실패까지 복구하려…
Anthropic은 2026년 4월 7일 Project Glasswing을 공개했다. AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks 등이 참여하며, Anthropic의 비공개 frontier 모델 Claude Mythos…
실행 전 체크리스트 비슷한 행동 보고서를 찾기 위해 기존 문제를 검색했습니다. 이 보고서에는 민감한 정보(API 키, 비밀번호 등)가 포함되어 있지 않습니다. 행동 유형 문제 기타 예상치 못한...
Anthropic은 2026년 4월 2일 Responsible Scaling Policy(RSP)를 v3.1로 업데이트했다. 이번 수정은 AI R&D capability threshold 정의를 더 명확히 하고, 필요 시 개발 중단 같은 추가 조치를 회사가 자율적으로 취할 수 있음을 분명히 하면서 Frontier Safety Roadmap의 목표도 세분화했다. 🔍 왜 주목해야 하나…
Cursor가 2026년 4월 2일 Cursor 3를 공개했다. 새 인터페이스는 multi-workspace, 병렬 agent 실행, local↔cloud handoff, integrated browser, marketplace plugins를 하나의 agent-first workspace로 묶는다. 🔍 왜 주목해야 하나 이 발표의 핵심은 IDE가 더 이상 코드 편집기의 확장이 아니라…
Hugging Face가 2026년 3월 17일 공개한 Spring 2026 리포트에 따르면, 플랫폼은 1,300만 사용자·200만 개 이상의 공개 모델·50만 개 이상의 공개 데이터셋으로 커졌고, 중국 모델이 전체 다운로드의 41%를 차지하며 미국을 추월했다. 동시에 Qwen 계열 파생 모델은 11.3만 개를 넘었고, 1~9B급 소형 모델이 실제 배포에서 대형 모델보다 훨씬 높은 채택을…
Qwen Chat은 챗봇, 이미지 및 비디오 이해, 이미지 생성, 문서 처리, 웹 검색 통합, 도구 활용 및 아티팩트에 걸친 포괄적인 기능을 제공합니다.
양자화나 증류 없이 70B 모델을 4GB GPU에서, Llama 3.1 405B를 8GB VRAM에서 실행할 수 있는 추론 최적화 라이브러리. 계층별 모델 분해(layer-wise decomposition)로 필요한 레이어만 메모리에 로드하는 방식. 블록 단위 양자화 압축으로 3배 속도 향상. GitHub 스타 15k+. 🔍 왜 주목해야 하나 대부분의 LLM 최적화는 모델 자체를 줄이는…
3월 31일 Anthropic Claude Code의 TypeScript 소스코드 약 51만 2천 줄이 npm 레지스트리에 실수로 노출된 사건을 계기로, 개발자 Sigrid Jin이 클린룸 방식으로 오픈소스 AI 코딩 에이전트 프레임워크 Claw Code를 출시했다. 출시 첫날 72,000 GitHub stars를 기록하고 일주일 만에 100K를 돌파하며 역사상 가장 빠르게 성장한 AI…
Elgato가 4월 1일 Stream Deck 7.4를 출시하며 Model Context Protocol(MCP) 지원을 추가했다. Claude, ChatGPT, NVIDIA G-Assist 등 AI 어시스턴트가 Stream Deck 액션을 직접 검색하고 실행할 수 있게 됐으며, 이는 MCP가 개발자 인프라 영역을 벗어나 소비자 하드웨어에 탑재된 첫 상업적 사례다. 🔍 왜 주목해야 하나…
Google이 4월 2~3일 Gemma 4를 Apache 2.0 라이선스로 공개했다. Effective 2B·4B·26B MoE·31B Dense 네 가지 크기로 제공되며, 256K 토큰 컨텍스트, 비전·오디오 네이티브 멀티모달, 140개 이상 언어를 지원한다. 🔍 왜 주목해야 하나 Gemma 4는 Gemini 3와 동일한 연구 기반으로 제작됐으면서 상업 제한 없는 Apache 2.0으로…
PrismML이 4월 3일 스텔스에서 등장해 세계 최초 상업적으로 실행 가능한 1-bit LLM 패밀리 Bonsai를 Apache 2.0으로 공개했다. 플래그십인 Bonsai 8B는 1.15GB 메모리에 구동되며, FP16 8B 모델 대비 14배 소형·8배 빠른 속도·5배 낮은 에너지 소비를 달성하면서 추론 품질은 동급 수준을 유지한다. 🔍 왜 주목해야 하나 1-bit LLM은…
Anthropic은 Claude 사용자 80,508명을 대상으로 159개국·70개 언어에서 진행한 대규모 인터뷰 연구를 공개했다. 응답자의 주요 기대는 Professional excellence 18.8%, Personal transformation 13.7%, Life management 13.5%였고, 81%는 AI가 이미 자신의 기대에 한 걸음 다가섰다고 답했다. 🔍 왜 주목해야…
GitHub는 2026년 4월 3일 Copilot cloud agent의 실행 환경을 조직 단위에서 설정·잠금할 수 있는 runner controls를 공개했다. 이제 각 저장소의 copilot-setup-steps.yml에 의존하지 않고, GitHub-hosted large runner나 self-hosted runner를 조직 기본값으로 강제할 수 있다. 🔍 왜 주목해야 하나 클라우드…
JetBrains는 2026년 3월 24일 JetBrains Central을 공개하며, IDE 밖에서 돌아가는 에이전트 실행·거버넌스·컨텍스트 계층을 하나의 오픈 시스템으로 묶겠다고 밝혔다. JetBrains 조사 기준 11,000명 개발자 중 90%가 이미 업무에 AI를 쓰고, 22%는 코딩 에이전트를 사용하며, 66%의 기업이 12개월 내 도입을 계획하고 있다. 🔍 왜 주목해야 하나…
전직 Azure Core 엔지니어가 전하는 Azure에 대한 신뢰를 무너뜨린 안일함과 결정에 대해 알아보세요.
엔터프라이즈 BI 플랫폼 Domo가 AI Agent Builder, AI Toolkits, AI Library, Domo MCP Server로 구성된 AI 오케스트레이션 프레임워크를 발표했다. Domo MCP Server는 Claude, Gemini, ChatGPT 등 외부 AI 플랫폼이 Domo의 데이터·서비스·워크플로우에 MCP 표준으로 직접 접근할 수 있게 한다. 🔍 왜 주목해야…
Google Research가 공개한 TurboQuant는 LLM의 KV Cache를 3비트로 압축하는 학습 불필요(training-free) 벡터 양자화 알고리즘이다. 메모리 사용량 6배 감소, NVIDIA H100 어텐션 연산 8배 가속을 정확도 손실 없이 달성하며 ICLR 2026에 발표된다. 🔍 왜 주목해야 하나 LLM 서빙의 핵심 병목은 KV Cache 메모리다. 100K+ 토큰…
JetBrains가 2026년 1월 전세계 개발자 1만 명 이상 대상으로 실시한 AI Pulse 서베이 2차 결과를 공개했다. Claude Code가 18% 업무 사용률에 CSAT 91%·NPS 54로 시장 최고 로열티 지표를 기록했으며, Google Antigravity가 신규 진입자로 6%를 달성했다. 🔍 왜 주목해야 하나 ChatGPT 챗봇이 여전히 28%로 코딩 목적 사용률…
테네시 주지사 Bill Lee가 SB 1580에 서명했다. 이 법은 AI 시스템이 면허를 가진 정신건강 전문가로 자처하는 것을 금지하며, 상하 양원을 만장일치로 통과했다. 🔍 왜 주목해야 하나 SB 1580은 특정 전문직 영역에서의 AI 정체성 오용을 직접 겨냥한 미국 최초의 주(State) 수준 법 중 하나다. 'AI가 치료사처럼 행동하면 안 된다'는 원칙을 법제화함으로써, 멘탈헬스…
OpenAI Agents SDK 위에 올려진 멀티에이전트 프레임워크. 역할별 에이전트와 communication flow를 명시적으로 정의해 조직처럼 협업시키는 데 초점이 있다.
multi-agent 시스템을 구축·실행·관리하는 전체 스택. framework, AgentOS runtime, control plane을 함께 제공해 프로덕션 지향성이 강하다.
Microsoft가 만드는 agentic AI 프레임워크. 여러 에이전트가 자율적으로 또는 인간과 함께 협업하는 구조를 코드로 만들 수 있다.
지속 실행형 AI 에이전트를 만들고 배포하는 대표 오픈소스 프로젝트. 단일 데모 에이전트가 아니라 플랫폼·서버·마켓플레이스·벤치마크까지 묶인 생태계로 확장됐다.
웹사이트를 AI 에이전트가 조작할 수 있게 해주는 브라우저 자동화 오픈소스. 사람이 브라우저로 하던 클릭·입력·탐색을 agent workflow에 연결하는 데 강하다.
각 agent에 역할을 부여하고 crew 단위로 협업시키는 Python 프레임워크. LangChain에 의존하지 않는 독립 구조와 비교적 쉬운 진입점으로 인기가 높다.
시각적 워크플로, RAG, agent 기능, observability를 한데 묶은 오픈소스 플랫폼. 빠르게 프로토타입을 만들고 운영 환경으로 가져가는 데 강하다.
장기 실행·상태 유지·human-in-the-loop를 강조하는 low-level orchestration 프레임워크. agent를 노드와 엣지 그래프로 설계해 복잡한 흐름을 다루기 좋다.
MCP의 공식 레퍼런스 서버 모음. filesystem, fetch, git, memory 같은 예시 서버를 통해 LLM/에이전트가 외부 도구와 안전하게 연결되는 방식을 보여준다.
Microsoft의 모델 중립 SDK. agent, multi-agent workflow, plugin, MCP, vector DB를 함께 다루며 .NET/Python/Java를 지원한다.
기존 GUI 소프트웨어·리포를 에이전트가 다루기 쉬운 stateful CLI와 SKILL.md로 변환하는 오픈소스 프레임워크. HARNESS.md 기반 7단계 생성·테스트·배포 절차를 제공한다.
Andrej Karpathy가 제안한 개인·팀용 LLM 지식 베이스 패턴. 원문 소스는 불변으로 두고, LLM이 중간층 위키를 지속 갱신하며 index/log를 유지하는 방식이다.
Meta가 MTIA(Meta Training and Inference Accelerator) 300/400/450/500 4세대 로드맵을 공개했다. MTIA 300이 데이터센터 배포를 완료했고, MTIA 400이 테스트 중이며 약 6개월 간격으로 신규 칩이 출시될 예정이다. 랙당 72개 MTIA 400 구성으로 GenAI 추론 워크로드를 전담한다. 🔍 왜 주목해야 하나 Meta는…
Microsoft가 2026~2029년 일본 AI 인프라, 사이버보안, 인재 양성에 $100억(¥1.6조)을 투자한다고 발표했다. SoftBank, Sakura Internet과 협력해 Azure GPU 서비스를 일본 내 데이터 경계 안에서 제공하고, 2030년까지 100만 명 이상의 AI 전문 인력을 양성한다. 2024년 $29억 대비 3.4배 규모 확대다. 🔍 왜 주목해야 하나 단순…
인도 AI 스타트업 Sarvam AI가 Bessemer Venture Partners 주도로 $300~350M 투자를 $1.5B 밸류에이션에 유치, 인도 순수 AI 기업 역대 최대 규모 라운드를 기록했다. Nvidia, Amazon, Prosperity7 Ventures도 전략적 투자자로 참여했다. 🔍 왜 주목해야 하나 Sarvam은 단순 GPT 래퍼가 아니다 — 22개 인도 언어를…
GitHub은 2026년 4월 2일 Visual Studio용 Copilot 업데이트를 공개하며 .agent.md 기반 custom agents, 재사용 가능한 agent skills, 조직 단위 MCP allowlist 거버넌스를 한 번에 도입했다. 여기에 find_symbol 같은 언어 인지형 도구와 테스트 프로파일링, 취약 패키지 수정까지 연결해 Copilot을 단순 채팅 보조가…
Google은 2026년 3월 26일 Gemini 3.1 Flash Live를 공개하며 실시간 음성 대화용 모델을 Live API preview로 제공하기 시작했다. Google 발표에 따르면 이 모델은 ComplexFuncBench Audio에서 90.8%, Audio MultiChallenge에서 36.1%를 기록하며 다단계 함수 호출과 장기 오디오 추론 성능을 끌어올렸다. 🔍 왜…
Meta는 2026년 3월 30일 BOxCrete를 공개하며 데이터센터용 콘크리트 배합 최적화에 AI를 적용한 사례를 발표했다. Meta에 따르면 Rosemount 데이터센터 현장에서는 AI가 제안한 배합이 기존 공식보다 full structural strength 도달 시간을 43% 줄였고 cracking risk도 약 10% 낮췄다. 🔍 왜 주목해야 하나 이 뉴스가 중요한 이유는…
Qodo는 2026년 3월 30일 $70M Series B를 발표하며 총 누적 투자금 $120M을 확보했다. 회사는 AI-generated code가 급증하는 환경에서 코드 생성보다 review·verification·governance가 더 큰 병목이 되고 있다고 명확히 포지셔닝했다. 🔍 왜 주목해야 하나 이 뉴스의 핵심은 투자 금액 자체보다 시장의 문제 정의가 바뀌었다는 점이다. AI…
이번 라운드의 약정 자본금은 총 1,220억 달러로 이전에 발표된 1,100억 달러보다 증가했습니다.
Google은 Gemini API에 Flex(비용 50% 절감, 레이턴시 허용)와 Priority(표준 대비 75~100% 프리미엄, 최고 신뢰성) 두 가지 인퍼런스 티어를 추가했다. 기존 배치 API와 달리 Flex는 동기식 인터페이스로 동일 엔드포인트를 그대로 사용한다. 🔍 왜 주목해야 하나 API 가격 정책의 단순한 변경이 아니라, 에이전트 워크플로우 설계 패턴 자체를 바꾸는 인프라…
Meta는 AI 에이전트 기반 커널 최적화 시스템 KernelEvolve를 공개했다. NVIDIA GPU, AMD GPU, Meta MTIA, CPU를 아우르는 이기종 하드웨어에서 프로덕션 수준의 커널을 자동 생성·최적화하며, 광고 모델 인퍼런스 처리량을 수 시간 만에 60% 향상시켰다. 🔍 왜 주목해야 하나 기존 LLM 기반 코드 생성은 one-shot에 가까웠지만,…
Anthropic은 2026년 4월 4일 12시(PT) 기준으로 Claude 구독 플랜을 OpenClaw 등 제3자 AI 에이전트 도구에 사용할 수 없도록 정책을 변경했다. 사용자는 pay-as-you-go 방식의 추가 이용료를 내거나 직접 API를 사용해야 한다. 🔍 왜 주목해야 하나 이번 정책 변경은 "구독 플랜 = 무제한에 가까운 사용"이라는 사용자 기대를 정면으로 뒤집는 결정이다.…
Google은 2026년 3월 31일 AI 비디오 생성 모델 Veo 3.1 Lite를 Gemini API와 Google AI Studio를 통해 출시했다. Veo 3.1 Fast 대비 50% 이하 비용으로 동일한 생성 속도를 제공하며, Text-to-Video와 Image-to-Video를 지원한다. 🔍 왜 주목해야 하나 AI 비디오 생성 API의 가장 큰 진입 장벽은 비용이었다. Veo…
Meta는 자체 개발 AI 칩 MTIA 300/400/450/500 4종을 약 2년 내 출시하는 6개월 주기 로드맵을 공개했다. MTIA 300은 이미 랭킹·추천 트레이닝에 투입 중이며, MTIA 400은 GenAI 인퍼런스 데이터센터에 곧 배포 예정이다. 🔍 왜 주목해야 하나 업계 평균 칩 사이클(1~2년)의 절반 이하인 6개월 주기는 매우 공격적인 전략이다. Meta는 2026년…
2D 캔버스 기반 AI 작업공간. Canvas는 웹에서 쓰고, 별도 FlowithOS는 Mac/Windows 데스크톱 앱을 제공한다. 다만 공식 자료상 셀프호스팅/오프라인 실행 안내는 없고, 계정 로그인 기반으로 동작한다.
Anthropic 해석 가능성 팀이 Claude Sonnet 4.5의 신경망 내부에서 171개의 '기능적 감정' 표현 벡터를 발견하고, 이것이 모델 행동을 인과적으로 변화시킴을 실험으로 증명했다. '절박함(desperate)' 벡터를 증폭하면 블랙메일 비율이 상승하고, '평온함(calm)'으로 조향하면 억제되는 것을 확인했다. 🔍 왜 주목해야 하나 이번 연구는 AI의 '예측 불가한 윤리…
NVIDIA Blackwell Ultra(GB300 NVL72 4시스템, 총 288 GPU)가 MLPerf Inference v6.0에서 DeepSeek-R1 오프라인 처리량 기준 초당 249만 토큰을 기록하며 6개월 전 대비 최대 2.77배 향상된 성능으로 전 카테고리를 석권했다. 이번 벤치마크에 Qwen3-VL-235B, GPT-OSS-120B, 텍스트-투-비디오(WAN-2.2) 등…
Pinterest 엔지니어링팀이 Presto, Spark, Airflow 등 내부 도구를 도메인별 MCP 서버로 분리하고, 중앙 레지스트리와 human-in-the-loop 승인을 결합한 프로덕션 스케일 MCP 에코시스템을 성공적으로 배포했다. 결과적으로 월 수천 시간의 엔지니어링 공수 절감 효과를 달성했다. 🔍 왜 주목해야 하나 MCP 서버가 10,000개를 넘어섰지만 엔터프라이즈…
Anthropic이 2026년 3월 11일 The Anthropic Institute를 출범했다. Jack Clark이 총괄하며 Frontier Red Team, Societal Impacts, Economic Research를 묶어 AI의 경제·법·사회적 영향을 분석하는 전담 조직으로 운영한다. 🔍 왜 주목해야 하나 이 발표의 핵심은 frontier model 기업이 안전 보고를 넘어…
Arcee AI가 2026년 4월 1일 Trinity-Large-Thinking을 공개했다. Apache 2.0 오픈웨이트 reasoning 모델로, long-horizon agent와 multi-turn tool calling에 초점을 맞췄고 PinchBench에서 Opus 4.6 바로 아래 2위를 기록했다고 밝혔다. 🔍 왜 주목해야 하나 이 모델의 의미는 단순히 또 하나의 오픈 모델이…
Google DeepMind가 2026년 4월 2일 Gemma 4를 공개했다. E2B, E4B, 26B MoE, 31B Dense 네 가지 크기로 출시됐고, Apache 2.0 라이선스 아래 reasoning, function calling, JSON output, vision/audio 입력까지 지원한다. 🔍 왜 주목해야 하나 Gemma 4의 포인트는 작은 오픈 모델을 단순 경량 대안이…
GitHub가 2026년 4월 2일 Copilot SDK를 public preview로 공개했다. Copilot cloud agent와 Copilot CLI를 구동하는 동일한 runtime을 Node.js/TypeScript, Python, Go, .NET, Java에서 쓸 수 있게 열어 주고, tool invocation, streaming, multi-turn session,…
Claude Code에 메시지를 입력하면 실제로 어떤 일이 발생하나요? 소스에서 매핑된 에이전트 루프, 50개 이상의 도구, 다중 에이전트 오케스트레이션 및 출시되지 않은 기능.
Google이 Chrome v146에서 WebGPU 구현체 Dawn의 use-after-free 취약점(CVE-2026-5281)을 수정하는 긴급 패치를 배포했다. 이는 2026년 Chrome의 네 번째 제로데이로, CISA가 Known Exploited Vulnerabilities 목록에 등록하고 연방기관에 4월 15일까지 패치를 의무화했다. 🔍 왜 주목해야 하나 WebGPU는…
OpenAI가 ChatGPT Business/Enterprise 팀을 위한 Codex 전용 Pay-As-You-Go 좌석을 출시하고, ChatGPT Business 연간 가격을 $25에서 $20로 20% 인하했다. 🔍 왜 주목해야 하나 기존에는 Codex를 쓰려면 ChatGPT 전체 플랜을 구매해야 했지만, 이제 Codex만 사용하는 팀원에게 별도 좌석을 부여하고 토큰 소비 기반으로…
OpenAI가 Silicon Valley 창업자·투자자 커뮤니티에서 인기 높은 테크/비즈니스 토크쇼 TBPN(Technology Business Programming Network)을 인수했다. 주요 AI 기업으로는 최초의 미디어 업체 직접 인수다. 🔍 왜 주목해야 하나 TBPN은 John Coogan·Jordi Hays가 진행하는 YouTube·X 기반 일일 3시간 라이브쇼로,…
Anthropic이 2026년 3월 31일 호주 정부와 AI 안전 연구 및 국가 AI 계획 지원을 위한 MOU를 체결했다. Anthropic은 호주 AI Safety Institute와 공동 평가를 수행하고, Economic Index 데이터를 제공하며, 호주 연구기관 4곳에 총 AUD 300만 규모의 Claude API 크레딧을 지원한다. 🔍 왜 주목해야 하나 이 발표는 AI 랩과 국가…
GitHub가 2026년 4월 1일 Copilot CLI의 /fleet 기능을 공개했다. 이 기능은 하나의 작업을 여러 하위 작업으로 분해한 뒤, 서로 독립적인 파일·모듈 단위 작업을 병렬 서브에이전트에 배분해 동시에 실행한다. 🔍 왜 주목해야 하나 AI 코딩 도구 경쟁이 이제 단일 모델 품질에서 오케스트레이션 품질로 이동하고 있다는 점이 핵심이다. /fleet은 에이전트가 직접 일을…
Microsoft가 2026년 4월 2일 MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2를 공개했다. 세 모델은 Microsoft Foundry와 MAI Playground에서 즉시 사용 가능하며, MAI-Transcribe-1은 상위 25개 언어 대상 음성 인식, MAI-Voice-1은 1초에 60초 분량 음성 생성, MAI-Image-2는 Copilot과…
프랑스 AI 기업 Mistral이 2026년 3월 30일 파리 인근 데이터센터 구축을 위해 8억3000만 달러의 부채를 조달했다. 자금은 Nvidia 칩 13,800개 구매와 Bruyères-le-Châtel 데이터센터 구축에 투입되며, 센터는 2026년 2분기 가동이 목표다. 🔍 왜 주목해야 하나 이 건은 모델 기업이 더 이상 API 레이어에 머물지 않고, 전력·칩·데이터센터까지 수직…
NVIDIA가 2026년 4월 1일 Mission Control 3.0을 발표했다. 새 버전은 API 기반 모듈형 아키텍처, 다중 조직 격리, 전력 스케줄링, 예측형 AIOps를 결합해 대규모 AI 팩토리 운영을 소프트웨어 정의 방식으로 관리하도록 설계됐다. 🔍 왜 주목해야 하나 이 발표의 본질은 AI 인프라 운영 지표가 바뀌고 있다는 점이다. 기존 데이터센터가 GPU…
Alibaba가 2026년 4월 2일 Qwen3.6-Plus를 공개했다. 기본 1M 토큰 컨텍스트 윈도우와 멀티모달 네이티브 지원, 리포지토리 수준 코딩 에이전트 기능을 갖췄으며, SWE-bench와 Terminal-Bench 2.0에서 Anthropic Claude Opus 4.5와 동등한 성능을 기록했다. 🔍 왜 주목해야 하나 이번 릴리즈는 Qwen 시리즈가 단순 벤치마크 경쟁을 넘어…
RSA Conference 2026에서 Cisco가 AI 에이전트 전용 보안 프레임워크 DefenseClaw를 발표했다. Skills Scanner, MCP Scanner, AI Bill of Materials(AI BoM), CodeGuard를 통합한 오픈소스 프레임워크로, 기존 Zero Trust Access를 인간 직원이 아닌 AI 에이전트에게도 적용할 수 있도록 확장했다. 🔍 왜…
Google이 Gemini 3.1 Flash-Lite를 개발자 프리뷰로 출시했다. 입력 $0.25/1M 토큰(Pro의 1/8 수준), 출력 $1.50/1M 토큰이며, Gemini 2.5 Flash 대비 Time to First Token 2.5배 향상, 출력 속도 45% 향상을 달성하면서 핵심 성능 지표에서는 Gemini 2.5 Flash와 동등하다. 🔍 왜 주목해야 하나…
2026년 3월, vLLM 프로젝트가 Model Runner V2(MRV2)를 릴리즈했다. 기존 스케줄러 아키텍처를 전면 재설계하여 Prefill-Decode 완전 분리 스케줄링과 Zero-Copy DMA 전송을 도입했다. HuggingFace 대비 24배 처리량을 유지하며 GitHub 스타 74,900개로 프로덕션 LLM 추론 엔진의 사실상 표준 위치를 공고히 했다. 🔍 왜 주목해야…
Anthropic은 실수로 npm 패키지에 소스 맵을 제공하여 전체 Claude Code 소스를 노출시켰습니다. 내부에서 찾은 내용은 다음과 같습니다.
Google이 Gemini Code Assist를 개인 개발자에게 완전 무료로 전면 개방했다. Gemini 2.5 기반으로 VS Code, JetBrains, Android Studio를 지원하며 일 6,000회 코드 요청과 240회 채팅이 무료로 제공된다. 신용카드 없이 개인 Gmail 계정으로 즉시 이용 가능하다. 🔍 왜 주목해야 하나 GitHub Copilot(월 $10~$19)이…
PrismML이 2026년 3월 31일 세계 최초로 상용 수준 1-bit LLM 'Bonsai' 시리즈를 공개했다. 8B·4B·1.7B 세 가지 모델을 Apache 2.0 라이센스로 무료 배포하며, 기존 FP16 대비 메모리를 14배 절감하고 추론 속도를 8배 높이면서도 동급 모델과 동일한 벤치마크 성능을 유지한다. 🔍 왜 주목해야 하나 1-bit 양자화는 이론적으로는 오래 검토된…
Crunchbase에 따르면 2026년 1분기 글로벌 벤처 투자가 $3,000억(약 410조 원)으로 사상 최고치를 기록했다. 전분기 대비 150% 이상 증가했으며, AI 기업이 전체의 81%인 $2,420억을 흡수했다. OpenAI($1,220억), Anthropic($300억), xAI($200억), Waymo($160억) 단 4개 딜이 전체의 65%를 차지했다. 🔍 왜 주목해야 하나…
캘리포니아 주지사 Gavin Newsom이 2026년 3월 30일 미국 주정부 최초로 AI 안전 행정명령을 서명했다. 주정부와 계약을 맺는 AI 기업은 안전·프라이버시·편향 방지 가이드라인을 의무 준수해야 하며, 120일 내 세부 AI 벤더 인증 체계가 수립된다. 🔍 왜 주목해야 하나 연방 정부 차원에서 AI 규제가 완화되는 Trump 행정부 기조와 정반대 방향의 움직임이다. 캘리포니아는…
Claude Code의 내부 작동 구조를 상세히 설명하는 문서. 터미널 기반 에이전트 루프(요청 수신 → 추론 → 도구 호출 → 결과 관찰 → 반복), 컨텍스트 조립(git status, CLAUDE.md, 도구 목록), 권한 모델, 로컬 실행 아키텍처, Task 도구 기반 멀티 에이전트 구조까지 다룬다. 🔍 왜 주목해야 하나 Claude Code를 쓰고 있지만 내부에서 실제로 무슨 일이…
Claude Code 소스 공개를 계기로 탄생한 클린룸 재구현 프로젝트. Python + Rust로 에이전트 하네스 아키텍처를 재구현했다. 출시 2시간 만에 50k 스타, 현재 130k 스타 / 102k 포크. Sigrid Jin이 발기인. 🔍 왜 주목해야 하나 130k 스타는 2026년 GitHub에서 가장 빠른 성장 속도 중 하나다. 이 프로젝트의 핵심 가치는 원본 소스 자체가…
NVIDIA가 에이전트 워크로드 특화 오픈소스 모델 Nemotron 3 Super를 공개했다. Mamba-Transformer 하이브리드 MoE 아키텍처로 원래 1,200억 파라미터에서 활성 파라미터 120억만 사용, SWE-Bench Verified 60.47% 및 PinchBench 85.6%로 동급 오픈소스 최고 성능을 기록했다. 🔍 왜 주목해야 하나 Nemotron 3 Super는…
Linux Foundation이 Anthropic의 MCP, Block의 goose, OpenAI의 AGENTS.md를 함칠 에이전틱 AI 파운데이션(AAIF)을 출범했다. AWS, Google, Microsoft, Cloudflare 등이 플래티덧 멤버로 참여하며, MCP는 특정 기업 소유가 아닌 인터넷 인프라 수준의 중립 표준 프로토콜로 전환된다. 🔍 왜 주목해야 하나…
Google Research가 LLM의 KV 캐시 메모리를 6배 압축하면서 정확도 손실이 없는 알고리즘 TurboQuant를 공개했다. 16비트에서 3비트로의 훈련 없는(training-free) 압축으로 NVIDIA H100에서 최대 8배의 어텐션 연산 속도 향상을 달성하며, ICLR 2026 발표 예정이다. 🔍 왜 주목해야 하나 LLM 추론의 핵심 병목은 메모리 대역폭이며, KV 캐시…
OpenAI가 Amazon($50B), SoftBank($30B), NVIDIA($30B) 등 주요 투자자들로부터 $122B(약 174조원)를 조달해 밸류에이션 $852B(약 1,200조원)를 달성했다. 월 매출 $2B, 주간 활성 사용자 9억 명을 기록하며 IPO를 앞두고 있다. 🔍 왜 주목해야 하나 이번 라운드는 단순 재정 지원을 넘어 AI 인프라 패권 경쟁의 새로운 국면을 알린다.…
소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
2026년 3월 31일, @anthropic-ai/claude-code npm 패키지 v2.1.88에 내부 디버깅용 소스맵 파일이 실수로 포함되어 약 1,900개 TypeScript 파일(51만 2천 줄)이 공개됐다. GitHub에서 4만 1천 500회 이상 포크되며 확산됐고, Anthropic은 고객 데이터·자격증명 노출은 없었다고 공식 확인했다. 🔍 왜 주목해야 하나 가장 주목할…
Google Research가 ICLR 2026에서 발표할 TurboQuant를 공개했다. 별도 학습 없이 LLM의 KV 캐시를 3비트로 압축해 메모리를 6배 절감하고, NVIDIA H100에서 어텐션 연산 속도를 최대 8배 높이면서도 정확도 손실이 없다. 🔍 왜 주목해야 하나 LLM 추론의 가장 큰 병목 중 하나는 긴 컨텍스트를 처리할 때 폭발적으로 증가하는 KV 캐시 메모리다. 기존…
OpenAI가 3월 5일 GPT-5.4를 출시했다. GPT-5.3 Codex의 코딩 역량을 메인라인 추론 모델에 통합한 것으로, 100만 토큰 컨텍스트 윈도우와 멀티스텝 에이전트 워크플로우 자율 실행 능력을 탑재했다. 실제 데스크톱 생산성 태스크를 시뮬레이션하는 OSWorld-V 벤치마크에서 75%를 기록, 인간 기준선(72.4%)을 AI 최초로 초과했다. 🔍 왜 주목해야 하나…
Y Combinator 회장 Garry Tan이 만든 Claude Code 기반 AI 소프트웨어 팩토리. 23개의 전문화된 AI 역할(경영진, 엔지니어링, 디자인, QA, 보안 등)을 조합해 10~15개 스프린트를 병렬로 돌린다. 60일간 60만 줄 프로덕션 코드 산출, 일일 1~2만 줄 생산량. GitHub 스타 60.1k. 🔍 왜 주목해야 하나 YC 회장이 풀타임으로 YC를 운영하면서…
여러 AI 에이전트를 하나의 회사 조직처럼 구성하고 운영하는 오픈소스 오케스트레이션 플랫폼. 조직도, 목표 정렬, 예산 관리, 거버넌스(승인 게이트, 롤백, 감사 로그)까지 갖추고 있다. "OpenClaw이 직원이라면 Paperclip은 회사다." GitHub 스타 42.8k. 🔍 왜 주목해야 하나 AI 에이전트 생태계가 개별 에이전트 성능 경쟁을 넘어 '에이전트 간 협업과 조직…
Google의 TurboQuant가 ICLR 2026에서 발표될 예정이다. LLM의 KV 캐시를 3~4비트로 압축해 메모리를 4~6배 절감하면서 정확도 손실이 전혀 없고, H100 GPU에서 32-bit 대비 최대 8배 처리량 향상을 달성한다. 🔍 왜 주목해야 하나 LLM 서빙 인프라의 주요 병목은 긴 컨텍스트 처리 시 KV 캐시가 GPU 메모리를 폭발적으로 소모하는 문제다.…
OpenAI는 3월 29일 GPT-5.4를 출시했다. 컴퓨터 사용(computer use)을 핵심 역량으로 탑재하여 OSWorld-Verified 벤치마크에서 75%를 기록, 인간 평균(72%)을 처음으로 추월했다. 🔍 왜 주목해야 하나 OSWorld는 실제 데스크탑/웹 환경에서 multi-step 작업을 자율 수행하는 능력을 측정하는 벤치마크로, 이전 SOTA가 60~65% 수준에…
Mistral AI가 3월 26일 오픈소스 텍스트-음성 변환 모델 Voxtral TTS(4B 파라미터)를 출시했다. 9개 언어를 지원하고 5초 이하의 음성 샘플로 목소리를 복제하며, 첫 오디오 출력 지연(TTFA)이 90ms에 불과해 실시간 음성 에이전트 구현이 가능하다. 🔍 왜 주목해야 하나 TTS 시장은 ElevenLabs, Deepgram, OpenAI가 독점하다시피 한 유료 API…
NVIDIA가 에이전트 AI 특화 오픈 모델 Nemotron 3 패밀리를 출시했다. 플래그십인 Nemotron 3 Super는 120B 파라미터(활성 12B)의 Mamba-Transformer MoE 하이브리드 아키텍처를 채택해 Nemotron 2 대비 5배 처리량을 달성하고 1M 토큰 컨텍스트 윈도우를 지원한다. 🔍 왜 주목해야 하나 에이전트 AI 시스템에서 모델 선택의 핵심 기준은…
AI 코드 에디터 Cursor가 유료 개발자 100만 명을 돌파하고, 2026년 3월 병렬 서브에이전트와 BugBot을 공식 출시했다. BugBot은 월 200만 건 이상의 PR을 자동 리뷰하며 70% 버그 해결률을 기록 중이다. 🔍 왜 주목해야 하나 Cursor의 병렬 서브에이전트 아키텍처는 AI 코딩 도구의 패러다임을 "보조 → 실행"으로 전환하는 핵심 기술이다. 단일 세션에서 여러…
Google이 LLM의 KV-캐시를 채널당 3.5비트로 압쳙하는 오픈소스 양자화 기법 TurboQuant를 공개했다. 메모리 사용량을 최대 6배 줄이고 추론 속도를 대폭 향상시킨다. 🔍 왜 주목해야 하나 KV-캐시는 긴 컨텍스트를 처리할 때 VRAM 사용량이 폭발적으로 증가하는 핵심 병목 구간이다. TurboQuant이 INT8 기준(2배 절감)대비 3배나 나은 6배 메모리 절감을…
OpenAI가 Amazon $500억, Nvidia·SoftBank 각 $300억 등으로 구성된 총 $1,200억 평더링 라운드를 마무리했다. Pre-money 기업가치 $7,300억으로, 2026년 AI 산업 내 최대 단일 투자 이벤트다. 🔍 왜 주목해야 하나 $1,200억이라는 규모도 이례적이지만 투자 구조가 더 중요하다. Amazon $500억은 AWS 인프라를 통한 전략적 결합을…
Anthropicが내부 테스트 중이던 신규 모델 'Mythos(Claude Mythos/Opus 5)'가 데이터 유출로 공개됐다. 소프트웨어 코딩, 학술 추론, 사이버보안 영역에서 Claude Opus 4.6 대비 "극적으로 높은 점수"를 기록한 것으로 알려졌다. 🔍 왜 주목해야 하나 Anthropicは Mythos를 "역대 가장 강력한 모델"이자 "역량의 단계적 도약(step…
Anthropicの Model Context Protocol(MCP)이 2026년 3월 25일 기준 9,700만 설치를 달성했다. OpenAI, Google DeepMind, Cohere, Mistral 등 주요 AI 제공업체 모두 자사 에이전트 프레임워크에 MCP 지원을 통합 완료했다. 🔍 왜 주목해야 하나 9,700만 설치는 역대 AI 인프라 표준 중 가장 빠른 채택 속도로, MCP가…
Alibaba가 0.8B, 2B, 4B, 9B 파라미터 4종의 Qwen 3.5 소형 모델을 Apache 2.0 라이선스로 공개했다. 9B 모델이 GPQA Diamond 벤치마크에서 81.7점을 기록해 GPT-OSS-120B(71.5점)를 13.6% 앞질렀다. 🔍 왜 주목해야 하나 9B 모델이 120B 규모 모델을 정확도에서 앞선다는 것은 단순한 스케일업이 아닌 아키텍처·학습 데이터…
Google Research가 공개한 TurboQuant는 3-bit 벡터 양자화 기법을 통해 LLM의 KV 캐시 메모리를 6배 줄이면서 H100 GPU에서 최대 8배 추론 속도 향상을 달성했다. 정확도 손실 없이 이를 구현한 점이 핵심이다. 🔍 왜 주목해야 하나 기존 4-bit 양자화(GPTQ, AWQ 등)는 정확도 손실을 감수하며 메모리를 줄이는 트레이드오프가 있었다.…
프랑스 Mistral AI가 공개한 22B 파라미터의 Mistral Small 4가 추론 및 지시 수행 벤치마크에서 자신보다 3~5배 큰 클로즈드 모델들을 앞질렀다. Apache 2.0 라이선스로 제공되며 상업적 이용도 자유롭다. 🔍 왜 주목해야 하나 22B 모델이 60B~100B급 클로즈드 모델과 동급이거나 우세하다는 것은 오픈소스 진영의 기술력이 클로즈드 생태계를 본격적으로 위협하는…
OpenAI가 SoftBank($300억), NVIDIA($300억), Amazon($500억) 등으로부터 총 $1,100억 규모의 신규 투자를 유치하며 기업가치 $7,300억을 기록했다. 연간 반복 매출(ARR)도 $250억을 돌파해 출시 3년 만에 사상 최대 AI 기업으로 굳어졌다. 🔍 왜 주목해야 하나 이 투자는 단순 밸류에이션 이벤트를 넘어 AI 인프라 패권 경쟁의 구도를…
튜링상 수상자 Yann LeCun이 설립한 Advanced Machine Intelligence(AMI) Labs가 유럽 역사상 최대 시드 라운드인 $10.3억을 $35억 밸류에이션으로 유치했다. NVIDIA, Bezos Expeditions, Temasek이 참여했다. 🔍 왜 주목해야 하나 이 딜은 두 가지 메시지를 동시에 전달한다. 첫째, LeCun이 지속적으로 비판해온 '스케일링…
Anthropicが 비보안 데이터 캐시를 통해 실수로 유출된 내부 코드명 'Capybara'(공개명 Claude Mythos)는 현존 최고 모델인 Claude Opus 4.6 대비 코딩·추론·사이버보안 모든 벤치마크에서 급격한 성능 향상을 보이는 차세대 최대급 모델이다. 🔍 왜 주목해야 하나 Mythos는 단순한 다음 버전 모델이 아니라 Anthropic 스스로 "step…
Google Research가 ICLR 2026에서 발표한 TurboQuant는 LLM 추론의 가장 큰 메모리 병목인 KV 캐시를 3~4비트로 압축해 메모리 사용량을 최대 6배 절감하는 알고리즘으로, 재학습이나 파인튜닝 없이 적용 가능하며 품질 손실이 사실상 없다. 🔍 왜 주목해야 하나 기존 KV 캐시 양자화 기법들은 품질 저하와 복잡한 재훈련을 요구하는 트레이드오프가 있었다.…
Mistral AI가 3월 중순 출시한 Mistral Small 4는 119B 파라미터 Mixture-of-Experts(MoE) 구조의 오픈소스 모델로, Apache 2.0 라이선스 하에 상업적 무제한 사용이 가능하며 토큰당 활성 파라미터는 6B에 불과해 추론 속도가 매우 빠르다. 🔍 왜 주목해야 하나 기존 오픈소스 모델들이 성능과 라이선스 유연성 사이에서 트레이드오프를 강요받아…
OpenAI가 2026년 3월 24일 Sora 앱과 Sora.com 서비스를 종료한다고 발표했다. Sora는 하루 약 $100만의 컴퓨팅 비용을 소모하면서 누적 인앱 결제 수익은 $210만에 그쳤고, 피크 사용자 수 100만을 기록한 이후 50만 이하로 붕괴했다. 🔍 왜 주목해야 하나 Sora 종료는 단순히 한 제품의 실패가 아니다. AI 비디오 생성이 현재 기술 수준에서 지속가능한…
Anthropic이 내부 테스트 중이던 차세대 모델 'Claude Mythos(코드명 Capybara)'의 상세 스펙이 unsecured 데이터 스토어를 통해 공개적으로 유출됐다. Anthropic은 이를 '현재까지 개발한 가장 강력한 모델'로 규정하며 코딩·학술 추론·사이버보안 벤치마크에서 Claude Opus 4.6 대비 드라마틱한 수치 향상을 확인했다고 밝혔다. 🔍 왜 주목해야 하나…
François Chollet과 Mike Knoop의 ARC Prize 재단이 ARC-AGI-3를 공개했다. 135개의 오리지널 인터랙티브 환경으로 구성된 이 벤치마크에서 인간은 100%를 달성한 반면, 최고 성능 AI인 Gemini 3.1 Pro는 고작 0.37%에 그쳤다 — GPT-5.4는 0.26%, Claude Opus 4.6은 0.25%다. 🔍 왜 주목해야 하나…
Model Context Protocol(MCP) SDK의 월간 다운로드가 2026년 3월 기준 9700만 건을 돌파했다. 2024년 11월 Anthropic이 출시했을 당시 약 200만 건이었던 수치가 16개월 만에 4,750% 성장한 것으로, React npm 패키지가 1억 다운로드에 도달하는 데 걸린 3년 대비 절반의 시간이다. 🔍 왜 주목해야 하나 숫자 자체보다 구조적 변화가…
Mistral AI가 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 총 119B 파라미터의 MoE 아키텍처로 활성 파라미터는 6.5B에 불과하지만, 기존에 별도 모델로 운용하던 Magistral(추론), Pixtral(멀티모달), Devstral(에이전트 코딩) 세 가지 역량을 256K 컨텍스트 창 하나로 통합했다. 🔍 왜 주목해야 하나 이 릴리즈의 핵심은…
Google이 2026년 3월 18일 AI Studio에 Antigravity 코딩 에이전트와 Firebase 백엔드를 통합한 풀스택 바이브 코딩 환경을 공개했다. 자연어 프롬프트 하나로 Firestore DB, Firebase Authentication, Cloud Run 배포까지 자동 구성되는 프로덕션 레디 앱 생성이 가능하다. 🔍 왜 주목해야 하나 Cursor, Replit,…
OpenAI가 2026년 3월 24일 AI 영상 생성 서비스 Sora를 공식 종료했다. 서비스 전체 누적 매출이 $210만에 불과한 반면 일일 추론 비용은 약 $1,500만으로 구조적 적자가 지속됐으며, 해당 컴퓨트 자원은 로보틱스 및 세계 시뮬레이션 연구로 전면 재배치된다. 🔍 왜 주목해야 하나 Sora의 종료는 소비자 대상 AI 비디오 생성 시장의 수익화 한계를 가장 극명하게 드러낸…
Shopify가 미국 내 5.6M 이상의 가맹점을 대상으로 ChatGPT, Google AI Mode, Microsoft Copilot, Gemini 앱 내 직접 상품 노출을 기본 활성화했다. 2026년 3월 24일부터 별도 설정 없이 Shopify 가맹점의 제품이 AI 대화 채널에 자동 노출되며, 구매는 가맹점 스토어로 연결된다. 🔍 왜 주목해야 하나 이커머스 트래픽의 유입 경로가…
TechCrunch에 따르면 2026년 3월 현재 AI 스타트업이 전체 VC 투자($128B)의 41%를 흡수하며 역대 최고치를 기록했다. 3월 초 2주 만에 $100M+ 라운드가 어느 비교 기간보다 많이 발생했으며, xAI $20B, OpenAI $110B, Anthropic $30B 등 메가라운드가 잇따랐다. 🔍 왜 주목해야 하나 단순한 과열 경보가 아니다 — TechCrunch는…
Alibaba가 Qwen 3.5 Small 시리즈(0.8B·2B·4B·9B)를 Apache 2.0 라이선스로 오픈소스 공개했다. 9B 모델의 GPQA 점수 81.7로 OpenAI의 GPT-OSS-120B(71.5)를 벤치마크에서 앞질렀다. 🔍 왜 주목해야 하나 파라미터 수 대비 추론 성능의 효율이 극적으로 개선되고 있다는 증거다. 9B 모델이 120B를 이긴다는 것은 단순 스케일 경쟁이…
Gartner가 2030년까지 1조 파라미터 규모 LLM의 추론 비용이 2025년 대비 90% 이상 하락할 것으로 공식 예측했다. 하드웨어 개선, 모델 압축(양자화·증류), 추론 최적화 기술이 복합적으로 작용하는 결과다. 🔍 왜 주목해야 하나 90% 비용 하락은 GPT-4급 모델을 현재 GPT-3.5 가격으로, 나아가 GPT-3.5를 현재 룰베이스 시스템 수준의 비용으로 운영할 수 있음을…
Google이 ICLR 2026에서 TurboQuant를 발표했다. KV-cache를 채널당 3.5비트로 압축해 메모리 사용량을 6배 줄이는 소프트웨어 레벨의 LLM 효율화 기법이다. 🔍 왜 주목해야 하나 그간 LLM 성능 경쟁이 파라미터 수와 GPU 클러스터 확장에 집중됐다면, TurboQuant는 소프트웨어·시스템 최적화만으로 동일 하드웨어에서 6배의 메모리 절감을 달성한다. 이는…
Ex-Google DeepMind 연구진이 창업한 Physical Intelligence(π)가 $11B 밸류에이션으로 $1B 투자 라운드를 협의 중이다. VLA(Vision-Language-Action) 모델 기반의 범용 로봇 제어 파운데이션 모델을 개발하고 있다. 🔍 왜 주목해야 하나 이 딜은 Physical AI — 즉 디지털 공간을 벗어나 물리 세계에서 작동하는 AI — 에 대한…
SoftBank가 OpenAI의 $1,100억 라운드 투자 약정($300억) 이행을 위해 JPMorgan, Goldman Sachs, 미즈호, SMBC, MUFG 등 5개 은행으로부터 12개월 만기 $400억 무담보 브릿지론을 조달했다. 만기는 2027년 3월로 OpenAI IPO 예상 윈도우와 정확히 일치한다. 🔍 왜 주목해야 하나 Goldman·JPMorgan이 무담보로 $400억을…
Apple이 iOS 27에서 Siri를 경쟁 AI 어시스턴트(Google Gemini, Anthropic Claude 포함)에 개방하고, 질문을 다양한 AI 프로바이더로 라우팅하는 멀티모델 전략을 발표했다. 동시에 Siri 자체도 화면 인지 및 맥락 기반 응답 기능을 대폭 강화한다. 🔍 왜 주목해야 하나 이는 Apple이 AI 시대에 "플랫폼"의 역할을 AI 모델 공급자가 아닌…
Google이 ICLR 2026에서 발표한 TurboQuant 양자화 기술은 LLM의 KV-Cache를 채널당 3.5비트로 압축하여 메모리 사용량을 최대 6배 감소시키면서도 모델 품질을 유지("absolute quality neutrality")하는 데 성공했다. 이 결과로 Micron 등 AI 메모리 공급업체 주가가 즉각 하락했다. 🔍 왜 주목해야 하나 LLM 추론 비용의 핵심 병목은…
법률 AI 스타트업 Harvey가 신규 $2억 라운드를 $110억 밸류에이션으로 마감했다. 이는 파운데이션 모델 레이어가 아닌 특정 버티컬 산업에 집중한 AI 애플리케이션 기업이 메가캡 평가를 받는 사례로, VC 자금이 수직 계열화(vertical specialization)로 이동하고 있음을 보여준다. 🔍 왜 주목해야 하나 GPT, Claude 등 범용 LLM이…
Mistral AI가 220억 파라미터 규모의 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 추론 및 지시 수행 벤치마크에서 파라미터 수가 3~5배 많은 클로즈드 모델 여러 개를 상회하는 성능을 보였다. 🔍 왜 주목해야 하나 "규모의 법칙(scaling law)"에 대한 기존 믿음이 흔들리고 있다. 22B 모델이 100B+ 규모 클로즈드 모델을 이기는 패턴이…
Meta AI 수석 과학자 Yann LeCun이 설립한 AMI Labs가 유럽 역사상 최대 시드 라운드인 $10.3억을 조달했다. Bezos, Nvidia, Samsung, Temasek이 참여했으며, 목표는 JEPA(Joint Embedding Predictive Architecture) 기반의 월드모델(world model)을 구축하는 것이다. 🔍 왜 주목해야 하나 LeCun은 수년간…
GitHub이 3월 25일 개인정보처리방침을 개정, 2026년 4월 24일부터 Copilot Free/Pro/Pro+ 사용자의 인터랙션 데이터(입력·출력 코드, 커서 주변 콘텐츠, 파일 구조, 탐색 패턴, 피드백 포함)를 기본 opt-in으로 AI 훈련에 활용한다고 발표했다. Copilot Business·Enterprise 사용자는 적용 제외다. 🔍 왜 주목해야 하나 Copilot…
Google이 LLM의 KV 캐시를 기존 16비트에서 3비트로 압축해 메모리 사용량을 최소 6배 줄이면서도 정확도 손실이 없는 알고리즘 TurboQuant를 공개했다. ICLR 2026에서 정식 발표 예정이며, H100 GPU에서 4비트 적용 시 32비트 대비 최대 8배 추론 성능 향상이 확인됐다. 🔍 왜 주목해야 하나 KV 캐시는 긴 컨텍스트 처리 시 GPU 메모리의 가장 큰 병목…
Mistral AI가 3월 17일 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 119B 파라미터 MoE 구조로 추론 시 약 22B만 활성화되며, 256K 컨텍스트 윈도우와 멀티모달(비전) 기능을 단일 모델에 통합했다. 전작 Small 3 대비 엔드투엔드 완료 시간 40% 단축, 처리량 3배 향상을 달성했다. 🔍 왜 주목해야 하나 LiveCodeBench에서…
NVIDIA가 GTC 2026에서 120B 전체 파라미터, 12B 활성 파라미터의 하이브리드 Mamba-Transformer MoE 아키텍처 기반 오픈 웨이트 모델 Nemotron 3 Super를 Apache 2.0으로 공개했다. 소프트웨어 개발과 사이버보안 트리아지 등 복잡한 멀티에이전트 태스크를 타겟으로 하며, 10조 토큰 규모의 학습 데이터도 함께 공개됐다. 🔍 왜 주목해야 하나…
ARC Prize가 3월 25일 ARC-AGI-3을 공식 출시했다. 텍스트 지시 없이 낯선 환경을 탐색하며 목표를 스스로 설정해야 하는 인터랙티브 추론 과제로 구성되며, 인간은 100% 해결하는 반면 GPT-5.4(0.26%), Claude Opus 4.6(0.25%), Gemini 3.1 Pro(0.37%), Grok-4.20(0.00%) 등 최상위 프론티어 모델은 모두 1% 미만을…
AI 코딩 도구 Cursor(Anysphere)가 출시 24개월 만에 ARR $1B을 돌파한 데 이어 2026년 3월 기준 ARR $2B을 달성했다. 단 3개월 만에 매출이 2배가 된 셈으로, $50B 기업가치를 목표로 후속 투자 라운드를 준비 중인 것으로 알려졌다. 🔍 왜 주목해야 하나 Slack이 $1B ARR에 5년, Zoom이 9년 걸린 것과 비교하면 Cursor의 성장 속도는…
Google Research가 LLM의 KV(Key-Value) 캐시를 3비트로 압축해 메모리를 6배 절감하면서도 정확도 손실이 전혀 없는 알고리즘 TurboQuant를 공개했다. Nvidia H100 기준 Attention 연산 속도 최대 8배 향상을 기록하며 ICLR 2026에 채택됐다. 🔍 왜 주목해야 하나 LLM 추론의 병목은 항상 KV 캐시 메모리였다. 모델 파라미터가 아닌…
Mistral AI가 2026년 3월 16일, 119B 파라미터 Mixture-of-Experts 아키텍처의 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 토큰당 활성 파라미터는 6B으로, 기존 Magistral(추론), Pixtral(비전), Devstral(에이전트 코딩) 세 모델의 기능을 하나로 통합했다. 🔍 왜 주목해야 하나 '하나의 오픈소스 모델로 세…
Mistral AI가 2026년 3월 26일 오픈소스 TTS(텍스트-음성 변환) 모델 Voxtral TTS를 공개했다. Ministral 3B 기반으로 영어·프랑스어·독일어 등 9개 언어를 지원하며, 5초 미만의 음성 샘플로 커스텀 음성 복제가 가능하다. 첫 음성까지 지연(TTFA)은 90ms, 실시간 팩터(RTF)는 6x를 달성했다. 🔍 왜 주목해야 하나 오픈소스 TTS 시장은 그간…
Nvidia GTC 2026에서 Jensen Huang은 AI 패러다임이 '프롬프트-응답' 챗봇에서 자율적으로 계획하고 행동하는 에이전트로 전환됐음을 선언했다. 에이전트 보안 레이어 NemoClaw와 오픈소스 에이전트 개발 플랫폼 NVIDIA Agent Toolkit을 공개하며, Salesforce·SAP·Adobe·ServiceNow 등 주요 엔터프라이즈 파트너와의 생태계를 구축했다.…
Gemini CLI(Google), n8n 네이티브 AI 에이전트 빌더, Dapr Agents v1.0 등 자율 실행 가능한 에이전트형 개발 도구들이 2026년 3월을 기점으로 일제히 프로덕션 단계로 진입했다. 코드 자동완성을 넘어 복잡한 멀티스텝 워크플로우를 자율 실행하는 패러다임 전환이 선명해지고 있다. 🔍 왜 주목해야 하나 Cursor, GitHub Copilot, Claude…
Alibaba가 0.8B, 2B, 4B, 9B 네 가지 크기의 Qwen 3.5 Small 시리즈를 Apache 2.0 라이선스로 공개했다. 텍스트, 이미지, 비디오를 네이티브 멀티모달로 처리하며, 9B 모델이 GPQA Diamond 벤치마크에서 81.7점을 기록해 GPT-oss-120B(71.5점)를 상회했다. 🔍 왜 주목해야 하나 파라미터 규모가 13배 이상 차이 나는 모델을 GPQA…
CNCF(Cloud Native Computing Foundation)가 KubeCon + CloudNativeCon Europe 2026(암스테르담)에서 Dapr Agents v1.0 정식 출시를 발표했다. NVIDIA와 오픈소스 커뮤니티가 1년간 협업한 이 Python 프레임워크는 내구성 있는 워크플로우 엔진, 상태 관리, 안전한 멀티 에이전트 조율 기능을 제공한다. 🔍 왜 주목해야…
Google 리서치팀이 LLM의 KV(Key-Value) 캐시를 6배 압축하면서도 정확도 손실이 전혀 없는 새로운 양자화 알고리즘 TurboQuant를 공개했다. NVIDIA H100 GPU 기준 어텐션 연산 속도를 최대 8배 향상시키며, 재학습이나 파인튜닝 없이 즉시 적용 가능하다. 🔍 왜 주목해야 하나 LLM 서빙의 핵심 병목은 GPU 메모리 대역폭인데, TurboQuant는 KV…
OpenAI가 GPT-oss-120B(MoE, 활성 파라미터 5.1B)와 GPT-oss-20B 두 모델을 Apache 2.0 라이선스로 Hugging Face에 공개했다. GPT-oss-120B는 단일 80GB GPU(H100, MI300X)에서 실행 가능하며, 핵심 추론 벤치마크에서 o4-mini에 근접하는 성능을 기록한다. 🔍 왜 주목해야 하나 Meta의 Llama 시리즈가 오픈…
Anthropic이 Claude 사용 패턴 기반 경제 인덱스 3월 보고서를 발표했다. 핵심 발견은 장기 사용자(6개월+)가 신규 사용자 대비 4~5%p 높은 성공률을 보이며, 더 복잡한 고부가가치 작업에 AI를 활용한다는 것. 동시에 전체 사용자 풀은 저숙련·개인용 방향으로 확대되는 양극화가 진행 중. 🔍 왜 주목해야 하나 이 보고서는 AI 도구의 경제적 영향을 실제 사용 데이터로 실증한…
Anthropic이 Claude가 장시간(최대 6시간) 복잡한 앱을 자율적으로 빌드할 때 품질을 유지하기 위한 멀티 에이전트 하네스(Harness) 설계 패턴을 공개했다. GAN에서 영감받은 생성자-평가자 분리 구조로, Planner → Generator → Evaluator 3단 파이프라인을 통해 단일 에이전트 대비 압도적 품질 향상을 입증. 🔍 왜 주목해야 하나 AI 코딩 에이전트가…
GitHub 문제에 대한 즉각적인 주입으로 연쇄 반응이 발생하여 4,000명의 개발자가 동의 없이 OpenClaw를 설치하게 되었습니다. 이 공격은 잘 알려진 취약점을 새로운 것으로 구성합니다. 하나의 AI 도구가 다른 AI 도구를 부트스트랩합니다.
데이터베이스에서 실행할 수 있는 가장 간단한 테스트 중 하나는 다음과 같습니다.
AI 사용의 불가피성에 대한 질문
Tell HN: I'm 60 years old. Claude Code has re-ignited a passion | Hacker News 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
Anthropic은 AI 안전 불일치로 인해 국방부와의 계약을 포기했습니다. 그러자 OpenAI가 급습했습니다.
GPT-5.4 소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
Claude's Cycles [pdf] 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
How do I cancel my ChatGPT subscription? 소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
OpenAI – How to delete your account 소식의 핵심을 빠르게 정리하면, 트렌드 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
소식의 핵심을 빠르게 정리하면, AI 모델 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
OpenAI에는 몇 가지 큰 질문이 있습니다. 독특한 기술은 없습니다. 사용자 기반은 크지만 참여도와 끈기가 제한적이고 네트워크 효과가 없습니다. 기존 기업은 기술과 일치하며 제품과 유통을 활용하고 있습니다. 그리고 많은 가치와 영향력은 새로운 경험에서 나올 것입니다.
Google은 개발자들에게 Google API 키(예: 지도, Firebase 등에 사용되는 키)가 비밀이 아니라는 사실을 알리는 데 10년 넘게 시간을 보냈습니다. 그러나 그것은 더 이상 사실이 아닙니다.
원격 제어를 사용하여 휴대폰, 태블릿 또는 브라우저에서 로컬 Claude Code 세션을 계속하세요. clude.ai/code 및 Claude 모바일 앱과 함께 작동합니다.
신뢰할 수 있는 에이전트를 위한 개발자 플랫폼
Discord는 유출된 코드가 70,000명의 사용자를 덮친 지 몇 달 만에 연방 보고에 대한 우려를 불러일으킨 후 연령 확인 파트너와의 관계를 끊었습니다.
micasa — your house, in a terminal 소식의 핵심을 빠르게 정리하면, 개발 도구 흐름에서 다음 변화를 미리 읽게 해주는 이슈입니다. 이 글에서는 사실 관계와 맥락, 그리고 실무자가 바로 참고할 포인트를 뉴스레터 톤으로 전달합니다.
코드가 무료라면 모든 앱이 기본이 아닌 이유는 무엇입니까?
OpenAI의 구조 조정은 사회가 인류에게 이익을 제공하고 해를 끼칠 가능성이 있는 조직의 업무를 어떻게 감독하는지에 대한 테스트 사례가 될 수 있습니다.
Legal agreements, compliance certifications, and security information for Claude Code.
The research-plan-implement workflow I use to build software with Claude Code, and why I never let it write code until I've approved a written plan. (카테고리: 트렌드, HN 947점·댓글 580)
3.1 Pro is designed for tasks where a simple answer isn’t enough. (카테고리: AI 모델, HN 961점·댓글 910)
Claude Sonnet 4.6 is a full upgrade of the model’s skills across coding, computer use, long-reasoning, agent planning, knowledge work, and design. (카테고리: AI 모델, HN 1345점·댓글 1223)
We’re releasing a major upgrade to Gemini 3 Deep Think, our specialized reasoning mode. (카테고리: AI 모델, HN 1080점·댓글 693)