Feature Article
Hugging Face State of Open Source Spring 2026 — 오픈 모델 경쟁의 축이 성능에서 주권·배포·파생 생태계로 이동
배경 및 맥락
오픈 모델 담론은 오랫동안 '폐쇄형 frontier model을 얼마나 빨리 따라잡는가'라는 관점으로 읽혔다. 그러나 실제 현장에서는 조금 다른 기준이 중요해지고 있다. 누가 더 다양한 크기의 모델을 제공하는지, 누가 더 많은 파생 생태계를 만들었는지, 특정 국가나 산업이 자국 규제와 인프라 안에서 직접 운영할 수 있는지가 채택을 좌우한다. 오픈소스 AI는 더 이상 이상주의적 대안이 아니라 비용, 주권, 공급망 리스크를 다루는 현실적 선택지가 됐다.
Hugging Face의 Spring 2026 보고서는 이 변화를 정량화한다. 보고서가 흥미로운 이유는 단순 인기 순위를 나열하는 데 그치지 않고, 국가별 출시 흐름, derivative models 수, 작은 모델의 실제 채택, robotics 데이터셋 성장 같은 운영 지표를 통해 오픈 생태계가 어디로 움직이는지를 보여준다는 점이다. 이는 모델 성능 경쟁만 보면 보이지 않는 산업 구조 변화를 드러낸다.
핵심 내용
보고서에 따르면 2025년 새로 만들어진 trending models의 다수는 China에서 개발됐거나 China-origin 모델 파생형이었다. Baidu는 2024년 Hub release가 사실상 없던 상태에서 2025년 100개 이상으로 급증했고, ByteDance와 Tencent도 공개 릴리즈를 8배에서 9배 수준으로 늘렸다. Alibaba의 Qwen 계열은 11만 3천 개 이상의 derivative models를 갖고 있고, Qwen 태그 전체로는 20만 개를 넘는 모델이 연결된다. 이는 개별 foundation model의 점수보다 파생 가능성과 재사용성이 더 강한 네트워크 효과를 만들고 있음을 뜻한다.
배포 관점의 데이터도 중요하다. 1-9B 파라미터 구간의 상위 모델들은 100B+ 모델 대비 median 기준 약 4배 더 많이 다운로드되며, 평균 다운로드 모델 크기는 2023년 8억 2,700만에서 2025년 208억으로 커졌지만 median은 3억 2,600만에서 4억 600만으로 소폭 증가하는 데 그쳤다. 즉 상위 사용층의 대형 모델 수요가 평균을 끌어올리지만, 바닥 수요는 여전히 소형·배포형 모델에 강하게 남아 있다는 뜻이다. 보고서는 또한 robotics 데이터셋이 2024년 1,145개에서 2025년 26,991개로 급증했다고 지적하며, 멀티모달·physical AI 방향으로 오픈 커뮤니티의 무게중심이 이동하고 있음을 보여준다.
경쟁 구도 / 비교
폐쇄형 frontier lab은 여전히 최고 성능과 대규모 compute에서 우위가 있지만, 오픈 생태계의 경쟁력은 다른 층위에서 커지고 있다. 빠른 파생, 지역 언어/규제 적합성, 저비용 배포, community fine-tuning 속도는 closed API가 쉽게 복제하기 어려운 장점이다. 특히 China의 공개 전략 강화와 South Korea의 sovereign AI initiative는 오픈 모델이 국가 단위 클라우드 전략과 맞물리고 있음을 보여준다.
이 점에서 오픈 생태계의 승부처는 단일 'best model'이 아니라 생태계 밀도다. Meta와 Google이 꾸준한 공개 릴리즈를 유지하는 반면, Qwen과 DeepSeek 계열은 파생 수와 지역 확산 속도에서 강한 존재감을 보이고 있다. 앞으로 기업은 모델 벤치마크뿐 아니라 derivative ecosystem과 community maintenance 속도를 함께 평가해야 한다.
의미
이 보고서가 주는 가장 큰 메시지는 오픈소스 AI가 주변부 대안이 아니라 주권, 비용, 배포 탄력성을 둘러싼 핵심 전략 축이 되었다는 점이다. closed frontier model이 최종 품질을 담당하더라도, 대량 선별·사내 배포·로컬 추론·규제 민감 워크로드는 open model이 맡는 hybrid stack이 더 일반화될 가능성이 높다.
실무적으로는 '어떤 최고 성능 모델을 쓸까'보다 '어떤 계층에 어떤 크기의 open model을 둘까'가 더 중요한 질문이 된다. 특히 다국어, 지역 규제, 비용 민감 업무를 가진 조직이라면 open model 운영 역량을 플랫폼 전략의 일부로 내재화할 필요가 있다.