PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

읽을거리

2026년 5월 27일

Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs — agent 인프라 경쟁이 GPU 단독에서 CPU 설계로 확장

NVIDIA는 2026년 5월 18일 자사 첫 custom CPU인 Vera를 Anthropic, OpenAI, SpaceXAI, Oracle Cloud Infrastructure에 인도했다고 발표했다. Vera는 88개의 Olympus 코어, 1.2TB/s 메모리 대역폭, 기존 설계 대비 50% 빠른 per-core 성능을 내세우며, agent orchestration·tool…

본문 읽기원문 보기

발행일

2026년 5월 27일

업데이트

2026년 5월 27일

주제

AI
산업
트렌드
원문 보기

배경 및 맥락

AI 인프라 논의는 오랫동안 GPU 중심으로 흘렀다. 하지만 agent가 실제로 동작하는 환경을 보면 상황이 다르다. tool 호출, 샌드박스 제어, 코드 실행, 상태 관리, 검색과 데이터 이동은 GPU보다 CPU와 메모리 서브시스템에 더 큰 부담을 준다. 특히 여러 에이전트가 병렬로 움직이고 세션이 길어질수록 CPU가 control plane이 아니라 throughput bottleneck이 되기 쉽다.

NVIDIA는 이번 발표를 통해 그 병목을 별도 제품군으로 다루겠다는 신호를 보냈다. Vera는 단순히 GPU를 보조하는 host CPU가 아니라, agentic workload를 위해 설계한 독립 사업 축으로 소개됐다.


핵심 내용

공식 블로그에 따르면 Vera는 NVIDIA의 첫 custom CPU이며, 첫 시스템이 Anthropic, OpenAI, SpaceXAI에 금요일에 전달되고 OCI에는 다음 월요일에 전달됐다. 이 CPU는 88개의 Olympus 코어와 1.2TB/s 메모리 대역폭을 갖추고, full load 기준 50% 빠른 per-core 성능을 제공한다고 설명됐다. NVIDIA는 Vera가 orchestration, tool calling, RL workload, data analytics, agent sandboxing, long-context state management를 주된 처리 대상으로 삼는다고 밝혔다.

또한 Vera는 Rubin GPU, BlueField-4 DPU, Spectrum-X와 함께 extreme codesign 스토리의 일부로 제시됐다. Vera Rubin NVL72에서는 두 개의 Rubin GPU와 NVLink-C2C로 연결되며, NVIDIA는 전통적 인프라 대비 2배 에너지 효율로 가속 연산을 계속 공급할 수 있다고 주장한다. OCI는 2026년부터 수십만 개의 Vera CPU를 배치할 계획이라고 밝혔고, hyperscale 수준의 agent 인프라로 바로 투입하겠다는 의도를 드러냈다.


경쟁 구도 / 비교

지금까지 AI 인프라 비교는 H100, B100, TPU 같은 accelerator 숫자로 요약되는 경우가 많았다. Vera는 그 비교 프레임이 불완전하다는 점을 보여준다. agent 시대에는 CPU가 단순 보조 장치가 아니라 전체 시스템 반응성과 단가를 좌우하는 실질적 병목이 되기 때문이다. 이는 x86 서버를 범용적으로 쓰던 구조에서, 특정 agent workload를 위한 purpose-built node architecture로 넘어가는 흐름을 강화한다.

클라우드 사업자 입장에서도 차별화 포인트가 달라진다. OCI가 Vera를 hyperscale에 먼저 올리겠다고 한 것은 GPU 수급 경쟁뿐 아니라 CPU·메모리·전력 효율을 포함한 전체 랙 설계 경쟁에서 선점 효과를 노리겠다는 뜻이다.


의미

산업적으로는 AI가 다시 한 번 하드웨어 지형을 재편하고 있다. GPU 공급 확보만으로는 충분하지 않고, agent workload의 제어 계층까지 최적화한 CPU 설계가 새로운 경쟁 단위가 됐다. 실무적으로는 추론 클러스터와 agent execution cluster를 같은 기준으로 설계하던 관행을 재검토해야 한다.

앞으로 agent 플랫폼 팀은 모델 품질과 API 비용만이 아니라 CPU saturation, memory bandwidth, sandbox density, energy efficiency를 운영 지표에 넣어야 한다. Vera 같은 제품이 시장에 안착하면, AI 시스템 아키텍처는 'GPU 얼마나 많이 확보했는가'보다 'agent execution path를 얼마나 균형 있게 설계했는가'로 평가받게 될 가능성이 높다.

이어 읽기

관련 읽을거리

전체 보기
2026년 6월 26일General Intuition Series A - gameplay data becomes the next action-model training substrateGeneral Intuition은 Khosla Ventures가 lead한 3억 2천만 달러 Series A를 발표하며, 가상 및 물리 환경에서 perceive, predict, act할 수 있는 모델을 만들겠다고 밝혔다. 보도에 따르면 post-money valuation은 23억 달러이며, TechCrunch는 이번 라운드 이후 누적 공개 funding이 4억 5,400만 달러라고…2026년 6월 23일Fika Jobs - AI interview agents expose the product-risk tradeoff in hiring automationTechCrunch는 Stockholm 기반 Fika Jobs가 AI interview agents와 short-form video profiles를 결합한 hiring platform으로 400만 달러 pre-seed를 유치했다고 보도했다. 후보자는 LinkedIn profile을 연결하고 Gemini 기반 agent가 생성한 약 10분 interview를 수행하며, Fika는 이를 짧은…2026년 6월 22일Reflection-SpaceX compute deal - open-source frontier AI hits a capacity wallNvidia-backed Reflection AI가 SpaceXAI의 Colossus 2 compute에 접근하는 대형 계약을 체결한 것으로 보도됐다. 계약 구조는 2026년 7월 1일부터 2029년까지 월 1.5억 달러, 총 약 USD 6.3B 규모로 알려졌고, Reflection은 GB300급 compute를 확보해 open-source frontier model 경쟁을 이어가려 한다.2026년 6월 21일NVIDIA Cannes AI marketing stack — agentic workflows move into campaign operationsNVIDIA는 Cannes Lions 2026 기간 Alembic, AWS, Criteo, Higgsfield, KERV.ai, Taboola 등이 NVIDIA infrastructure와 agent toolkit으로 광고·마케팅 AI를 운영 사례로 시연한다고 밝혔다. 사례에는 Criteo의 Blackwell 기반 약 2배 학습 속도 개선과 연 17,000 GPU hours 절감,…