글
Higher usage limits for Claude and a compute deal with SpaceX — AI 제품 경쟁의 병목이 모델 품질에서 compute allocation과 요금제 운영으로 이동
Anthropic은 2026년 5월 6일 Claude Code와 Claude API의 사용 한도를 상향한다고 발표했다. Pro·Max·Team·seat-based Enterprise의 5시간 한도를 2배로 늘리고, Pro·Max의 피크 시간대 제한을 없앴으며, 동시에 SpaceX Colossus 1 데이터센터의 전체 compute capacity를 확보해 300MW 이상, 22만 개가 넘는…
배경 및 맥락
최근 AI 서비스 경쟁은 더 큰 모델을 발표하는 단계에서 실제로 얼마나 오래, 얼마나 안정적으로 쓸 수 있는지를 증명하는 단계로 넘어가고 있다. 특히 coding agent와 long-running workflow는 짧은 질의응답보다 훨씬 많은 연속 토큰과 세션 시간을 요구하므로, 사용자 경험은 모델 자체보다 rate limit과 peak-time throttling에 더 크게 좌우된다.
Anthropic의 이번 발표는 바로 그 운영 병목을 정면으로 다룬다. 새 모델을 내놓기보다 기존 Claude Code와 API의 체감 용량을 늘리고, 이를 가능하게 하는 공급망과 데이터센터 계약을 함께 공개했다는 점에서 제품 전략과 인프라 전략이 결합된 발표다.
핵심 내용
Anthropic은 2026년 5월 6일부로 Claude Code의 5시간 사용 한도를 Pro, Max, Team, seat-based Enterprise 플랜에서 두 배로 늘리고, Pro와 Max의 피크 시간대 제한 축소를 제거한다고 밝혔다. 동시에 Claude Opus 계열 API rate limit도 상향했다.
이 조치의 기반으로 Anthropic은 SpaceX와 계약해 Colossus 1 데이터센터의 전체 compute capacity를 사용하게 됐다고 설명했다. 공개된 수치는 300메가와트 이상과 220,000개가 넘는 NVIDIA GPU다. Anthropic은 이 capacity가 Claude Pro와 Max 가입자의 실제 가용성 개선에 직접 연결된다고 명시했다.
경쟁 구도 / 비교
최근 AI 경쟁은 단순 벤치마크나 모델 세대 번호보다 누가 더 많은 inference capacity를 안정적으로 확보하느냐로 이동하고 있다. Anthropic은 이미 Amazon과 최대 5GW, Google·Broadcom과 5GW, Microsoft·NVIDIA와 Azure capacity, Fluidstack와의 인프라 투자까지 연쇄적으로 발표해 왔는데, 이번 SpaceX 계약은 그 흐름을 사용자-facing usage limit 개선으로 바로 연결한 사례다.
이는 더 좋은 모델보다 더 쓸 수 있는 모델이 구매 의사결정에 영향을 주는 국면을 보여준다. 특히 coding agent와 enterprise API 고객에게는 짧은 데모 성능보다 sustained throughput이 더 중요하다.
의미
산업적으로는 frontier AI 업체가 소프트웨어 기업이면서 동시에 전력·GPU·데이터센터 공급망을 설계하는 인프라 사업자로 변하고 있음을 보여준다. 제품 roadmap와 infra roadmap가 분리되지 않는 시대다.
실무적으로는 AI 도입 팀이 모델 품질 외에 세션 한도, 피크 시간 정책, regional capacity, 장기 rate limit 안정성까지 조달 평가표에 넣어야 한다. 앞으로 AI 서비스의 우위는 benchmark보다 지속 사용 가능성에서 더 자주 갈릴 가능성이 높다.