PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

읽을거리

2026년 4월 15일

Hugging Face State of Open Source Spring 2026 — 오픈 모델 경쟁의 축이 성능에서 주권·배포·파생 생태계로 이동

Hugging Face는 2026년 봄 오픈소스 AI 리포트를 통해 2025년 신규 trending model의 다수가 China에서 개발되었거나 China-origin 모델 파생형이었고, Alibaba의 Qwen 계열은 11만 3천 개 이상의 derivative models를 만들었다고 정리했다. 또 1-9B급 모델의 상위군은 100B+ 모델 대비 median 기준 약 4배 높은…

본문 읽기원문 보기

발행일

2026년 4월 15일

업데이트

2026년 4월 15일

주제

AI
트렌드
오픈소스
모델
산업
원문 보기

배경 및 맥락

오픈 모델 담론은 오랫동안 '폐쇄형 frontier model을 얼마나 빨리 따라잡는가'라는 관점으로 읽혔다. 그러나 실제 현장에서는 조금 다른 기준이 중요해지고 있다. 누가 더 다양한 크기의 모델을 제공하는지, 누가 더 많은 파생 생태계를 만들었는지, 특정 국가나 산업이 자국 규제와 인프라 안에서 직접 운영할 수 있는지가 채택을 좌우한다. 오픈소스 AI는 더 이상 이상주의적 대안이 아니라 비용, 주권, 공급망 리스크를 다루는 현실적 선택지가 됐다.

Hugging Face의 Spring 2026 보고서는 이 변화를 정량화한다. 보고서가 흥미로운 이유는 단순 인기 순위를 나열하는 데 그치지 않고, 국가별 출시 흐름, derivative models 수, 작은 모델의 실제 채택, robotics 데이터셋 성장 같은 운영 지표를 통해 오픈 생태계가 어디로 움직이는지를 보여준다는 점이다. 이는 모델 성능 경쟁만 보면 보이지 않는 산업 구조 변화를 드러낸다.


핵심 내용

보고서에 따르면 2025년 새로 만들어진 trending models의 다수는 China에서 개발됐거나 China-origin 모델 파생형이었다. Baidu는 2024년 Hub release가 사실상 없던 상태에서 2025년 100개 이상으로 급증했고, ByteDance와 Tencent도 공개 릴리즈를 8배에서 9배 수준으로 늘렸다. Alibaba의 Qwen 계열은 11만 3천 개 이상의 derivative models를 갖고 있고, Qwen 태그 전체로는 20만 개를 넘는 모델이 연결된다. 이는 개별 foundation model의 점수보다 파생 가능성과 재사용성이 더 강한 네트워크 효과를 만들고 있음을 뜻한다.

배포 관점의 데이터도 중요하다. 1-9B 파라미터 구간의 상위 모델들은 100B+ 모델 대비 median 기준 약 4배 더 많이 다운로드되며, 평균 다운로드 모델 크기는 2023년 8억 2,700만에서 2025년 208억으로 커졌지만 median은 3억 2,600만에서 4억 600만으로 소폭 증가하는 데 그쳤다. 즉 상위 사용층의 대형 모델 수요가 평균을 끌어올리지만, 바닥 수요는 여전히 소형·배포형 모델에 강하게 남아 있다는 뜻이다. 보고서는 또한 robotics 데이터셋이 2024년 1,145개에서 2025년 26,991개로 급증했다고 지적하며, 멀티모달·physical AI 방향으로 오픈 커뮤니티의 무게중심이 이동하고 있음을 보여준다.


경쟁 구도 / 비교

폐쇄형 frontier lab은 여전히 최고 성능과 대규모 compute에서 우위가 있지만, 오픈 생태계의 경쟁력은 다른 층위에서 커지고 있다. 빠른 파생, 지역 언어/규제 적합성, 저비용 배포, community fine-tuning 속도는 closed API가 쉽게 복제하기 어려운 장점이다. 특히 China의 공개 전략 강화와 South Korea의 sovereign AI initiative는 오픈 모델이 국가 단위 클라우드 전략과 맞물리고 있음을 보여준다.

이 점에서 오픈 생태계의 승부처는 단일 'best model'이 아니라 생태계 밀도다. Meta와 Google이 꾸준한 공개 릴리즈를 유지하는 반면, Qwen과 DeepSeek 계열은 파생 수와 지역 확산 속도에서 강한 존재감을 보이고 있다. 앞으로 기업은 모델 벤치마크뿐 아니라 derivative ecosystem과 community maintenance 속도를 함께 평가해야 한다.


의미

이 보고서가 주는 가장 큰 메시지는 오픈소스 AI가 주변부 대안이 아니라 주권, 비용, 배포 탄력성을 둘러싼 핵심 전략 축이 되었다는 점이다. closed frontier model이 최종 품질을 담당하더라도, 대량 선별·사내 배포·로컬 추론·규제 민감 워크로드는 open model이 맡는 hybrid stack이 더 일반화될 가능성이 높다.

실무적으로는 '어떤 최고 성능 모델을 쓸까'보다 '어떤 계층에 어떤 크기의 open model을 둘까'가 더 중요한 질문이 된다. 특히 다국어, 지역 규제, 비용 민감 업무를 가진 조직이라면 open model 운영 역량을 플랫폼 전략의 일부로 내재화할 필요가 있다.

이어 읽기

관련 읽을거리

전체 보기
2026년 4월 5일PrismML, Bonsai 1-bit LLM 출시 — 1GB 메모리로 8B 추론, 엣지 AI의 현실화PrismML이 4월 3일 스텔스에서 등장해 세계 최초 상업적으로 실행 가능한 1-bit LLM 패밀리 Bonsai를 Apache 2.0으로 공개했다. 플래그십인 Bonsai 8B는 1.15GB 메모리에 구동되며, FP16 8B 모델 대비 14배 소형·8배 빠른 속도·5배 낮은 에너지 소비를 달성하면서 추론 품질은 동급 수준을 유지한다.2026년 6월 25일GLM-5.2 - open long-context models push agentic coding toward 1M-token workspacesZ.AI는 GLM-5.2를 공개하며 1M-token context, flexible effort levels, MIT license, long-horizon coding benchmark 성능을 전면에 내세웠다. 공개 글은 IndexShare로 1M context에서 per-token FLOPs를 2.9x 줄이고, Terminal Bench 2.1 81.0, SWE-bench Pro…2026년 6월 24일Krea 2 technical report - open image models compete on creative control, not only fidelityKrea는 Krea 2 technical report를 공개하며 K2 Raw와 K2 Turbo 계열의 open-weights text-to-image foundation model을 설명했다. 보고서는 data curation, diffusion transformer architecture, multi-stage training, prompt expander, style-reference…2026년 6월 22일Reflection-SpaceX compute deal - open-source frontier AI hits a capacity wallNvidia-backed Reflection AI가 SpaceXAI의 Colossus 2 compute에 접근하는 대형 계약을 체결한 것으로 보도됐다. 계약 구조는 2026년 7월 1일부터 2029년까지 월 1.5억 달러, 총 약 USD 6.3B 규모로 알려졌고, Reflection은 GB300급 compute를 확보해 open-source frontier model 경쟁을 이어가려 한다.