PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

읽을거리

2026년 4월 4일

Meta, MTIA 4세대 AI 칩 6개월 주기 로드맵 공개 — GenAI 인퍼런스 전용 실리콘 전략

Meta는 자체 개발 AI 칩 MTIA 300/400/450/500 4종을 약 2년 내 출시하는 6개월 주기 로드맵을 공개했다. MTIA 300은 이미 랭킹·추천 트레이닝에 투입 중이며, MTIA 400은 GenAI 인퍼런스 데이터센터에 곧 배포 예정이다.

본문 읽기원문 보기

발행일

2026년 4월 4일

업데이트

2026년 4월 4일

주제

AI
산업
트렌드
원문 보기

배경 및 맥락

Meta는 수년간 추천·랭킹 시스템용으로 MTIA(Meta Training and Inference Accelerator)를 자체 개발해왔다. 초기 MTIA는 상대적으로 제한적인 역할에 머물렀으나, Llama 시리즈의 성공과 Meta AI 서비스의 폭발적 성장으로 인해 GenAI 인퍼런스 전용 실리콘 개발이 전략적 우선순위로 급부상했다.

2026년 2월 Meta는 NVIDIA 및 AMD와 각각 멀티-빌리언 달러 규모의 멀티-이어 공급 계약을 체결하면서도, 자체 MTIA 칩 로드맵을 통해 벤더 의존도를 줄이겠다는 투트랙 전략을 명확히 했다.


핵심 내용

4세대 MTIA 로드맵:

칩주요 용도상태
MTIA 300랭킹·추천 트레이닝프로덕션 배포 중
MTIA 400GenAI 인퍼런스 (주력)테스트 완료, 배포 임박
MTIA 450GenAI 인퍼런스 최적화2027년 배포 예정
MTIA 500GenAI 인퍼런스 최적화2027년 배포 예정

전략적 수치:

  • 2026년 CapEx 예산: $1,150억~$1,350억
  • 칩 출시 주기: 약 6개월 (업계 평균의 1/2~1/3)
  • Nvidia 멀티-이어 공급 계약 규모: 애널리스트 추정 $500억~$1,000억

설계 철학: 모듈식·재사용 가능한 설계를 기반으로 6개월 이하 주기 달성. MTIA 400 이후는 GenAI 워크로드에 1차 최적화하고, 랭킹·추천 등 기존 워크로드는 2차 적용.


경쟁 구도 / 비교

빅테크 커스텀 실리콘 경쟁 현황:

  • Google: TPU v5p (트레이닝) + Axion (ARM CPU 기반 인퍼런스)
  • Amazon: Trainium2 (트레이닝) + Inferentia3 (인퍼런스)
  • Microsoft: Azure Maia 2 (OpenAI 전용)
  • Meta: MTIA 300~500 (범용 → GenAI 인퍼런스 집중)

Meta의 차별점은 소셜 미디어 스케일의 랭킹 시스템과 GenAI 워크로드를 동일 칩 패밀리로 통합하려는 시도에 있다. 이는 Meta의 광고 시스템과 Meta AI 서비스가 동일 인프라를 공유하기 때문에 나타나는 독특한 요구사항이다.


의미

Meta의 MTIA 로드맵은 단순한 하드웨어 공개를 넘어, 대형 테크 기업들이 AI 인퍼런스 비용을 직접 통제하기 위해 실리콘 레이어까지 수직 통합하는 전략의 일환이다. 수조 건/일 규모의 인퍼런스를 처리하는 Meta 입장에서 단 10%의 비용 절감도 연간 수십억 달러 규모이기 때문에 자체 칩 개발의 ROI는 명확하다.

중장기적으로는 NVIDIA 의존도가 높은 기업들이 커스텀 실리콘으로 전환하는 속도를 가속화할 수 있다. 하지만 칩 설계부터 시스템 소프트웨어, 컴파일러 스택까지 방대한 투자가 필요하기 때문에 Meta 수준의 스케일 없이는 재현하기 어렵다.

이어 읽기

관련 읽을거리

전체 보기
2026년 6월 26일General Intuition Series A - gameplay data becomes the next action-model training substrateGeneral Intuition은 Khosla Ventures가 lead한 3억 2천만 달러 Series A를 발표하며, 가상 및 물리 환경에서 perceive, predict, act할 수 있는 모델을 만들겠다고 밝혔다. 보도에 따르면 post-money valuation은 23억 달러이며, TechCrunch는 이번 라운드 이후 누적 공개 funding이 4억 5,400만 달러라고…2026년 6월 23일Fika Jobs - AI interview agents expose the product-risk tradeoff in hiring automationTechCrunch는 Stockholm 기반 Fika Jobs가 AI interview agents와 short-form video profiles를 결합한 hiring platform으로 400만 달러 pre-seed를 유치했다고 보도했다. 후보자는 LinkedIn profile을 연결하고 Gemini 기반 agent가 생성한 약 10분 interview를 수행하며, Fika는 이를 짧은…2026년 6월 22일Reflection-SpaceX compute deal - open-source frontier AI hits a capacity wallNvidia-backed Reflection AI가 SpaceXAI의 Colossus 2 compute에 접근하는 대형 계약을 체결한 것으로 보도됐다. 계약 구조는 2026년 7월 1일부터 2029년까지 월 1.5억 달러, 총 약 USD 6.3B 규모로 알려졌고, Reflection은 GB300급 compute를 확보해 open-source frontier model 경쟁을 이어가려 한다.2026년 6월 21일NVIDIA Cannes AI marketing stack — agentic workflows move into campaign operationsNVIDIA는 Cannes Lions 2026 기간 Alembic, AWS, Criteo, Higgsfield, KERV.ai, Taboola 등이 NVIDIA infrastructure와 agent toolkit으로 광고·마케팅 AI를 운영 사례로 시연한다고 밝혔다. 사례에는 Criteo의 Blackwell 기반 약 2배 학습 속도 개선과 연 17,000 GPU hours 절감,…