FEATURE ARTICLE
ARC-AGI-3 출시 — 프론티어 모델 전부 1% 미만, AGI와의 간극 재확인
📌 핵심 요약 ARC Prize가 3월 25일 ARC-AGI-3을 공식 출시했다. 텍스트 지시 없이 낯선 환경을 탐색하며 목표를 스스로 설정해야 하는 인터랙티브 추론 과제로 구성되며, 인간은 100% 해결하는 반면 GPT-5.4(0.26%), Claude Opus 4.6(0.25%), Gemini 3.1 Pro(0.37%), Grok-4.20(0.00%) 등 최상위 프론티어 모델은 모두 1% 미만을 기록했다. 🔍 왜 주목해야 하나 ARC-AGI-2가 단순 RL과 그래프 탐색으로 12.58%까지 포화됐던 반면, ARC-AGI-3은 언어 지시 없이 환경과 직접 상호작용하는 능동적 학습을 요구함으로써 현재 LLM의 근본적 한계를 다시 드러냈다. '스케일 확장이 곧 AGI'라는 업계 관행에 정면 도전하는 결과로, 전혀 새로운 알고리즘 아이디어가 필요하다는 신호다. $2M 상금이 걸려 있어 커뮤니티 차원의 집중적인 연구 경쟁이 예상된다. ⚡ 실무 시사점 LLM 기반 에이전트가 '자율적으로 환경을 이해하고 적응한다'는 기대를 제품 설계에 반영하고 있다면 재검토가 필요하다. 현재 프론티어 모델의 에이전트 자율성은 과대평가되어 있으며, 에이전트 파이프라인에 인간 감독 단계를 반드시 유지해야 한다.