FEATURE ARTICLE

Alibaba Qwen 3.5 소형 모델 공개 — 9B 파라미터로 GPT-OSS-120B 능가, Apache 2.0 오픈소스

📌 핵심 요약 Alibaba가 0.8B, 2B, 4B, 9B 파라미터 4종의 Qwen 3.5 소형 모델을 Apache 2.0 라이선스로 공개했다. 9B 모델이 GPQA Diamond 벤치마크에서 81.7점을 기록해 GPT-OSS-120B(71.5점)를 13.6% 앞질렀다. 🔍 왜 주목해야 하나 9B 모델이 120B 규모 모델을 정확도에서 앞선다는 것은 단순한 스케일업이 아닌 아키텍처·학습 데이터 큐레이션의 질적 도약을 의미한다. Qwen 시리즈는 이미 오픈소스 LLM 리더보드에서 Meta의 Llama를 추월했으며, 이번 3.5 시리즈로 소형 모델 엣지·온디바이스 배포의 레퍼런스 모델로 자리잡을 가능성이 높다. Apache 2.0 라이선스로 상업적 이용에 제약이 없다는 점도 기업 채택을 가속한다. ⚡ 실무 시사점 온디바이스 AI나 저지연 추론이 필요한 서비스라면 Qwen 3.5 4B~9B 모델을 즉시 평가해볼 것. Llama 3.1 8B 대비 정확도를 비교 테스트하고, 특히 한국어 성능은 별도 벤치마크가 필요하다.

2026년 3월 30일수정 2026년 3월 30일원문 링크

배경 및 맥락

Alibaba의 Qwen 시리즈는 2023년 말 첫 공개 이후 매 세대마다 오픈소스 LLM 벤치마크 기록을 경신해왔다. Qwen 2.5 시리즈(2025년 초)가 Meta의 Llama 3 계열을 여러 벤치마크에서 앞서면서 오픈소스 AI 지형에서 중국 모델의 존재감이 급부상했다. Qwen 3.5는 이 흐름의 연장선에서 소형 모델 효율성에 집중한 릴리즈다.

2026년 3월 1일 공개된 이번 릴리즈는 Hugging Face에 즉시 업로드되어 커뮤니티 반응이 폭발적이었다.

핵심 내용

모델 라인업:

모델	파라미터	주요 용도
Qwen3.5-0.8B	0.8B	엣지/IoT 디바이스
Qwen3.5-2B	2B	모바일 온디바이스
Qwen3.5-4B	4B	노트북/저사양 서버
Qwen3.5-9B	9B	고성능 추론

벤치마크 결과 (GPQA Diamond):

Qwen3.5-9B: 81.7점
GPT-OSS-120B: 71.5점
Meta Llama 3.1 70B: 약 66점 (참고)

라이선스: Apache 2.0 (상업적 이용 무제한)

경쟁 구도 / 비교

Microsoft의 Phi-4(14B), Google의 Gemma 3(27B), Meta의 Llama 3.2(11B)와 직접 경쟁한다. 소형 모델 시장에서는 파라미터당 성능이 핵심 지표인데, Qwen3.5-9B는 이 지표에서 현재 오픈소스 최고 수준이다. 특히 GPQA Diamond(박사급 과학 문제)에서 120B 모델을 앞선다는 점은 데이터 품질과 RLHF 튜닝의 우수성을 방증한다.

의미

소형 LLM의 성능 한계가 빠르게 높아지면서, '성능이 필요하면 대형 모델·비용이 중요하면 소형 모델'이라는 이분법이 무너지고 있다. Qwen3.5-9B는 GPT-4급 지식 추론을 9B 파라미터로 달성해, 기업의 자체 호스팅 비용 구조를 크게 바꿀 수 있다. 또한 Apache 2.0 라이선스는 파인튜닝 후 상업적 판매까지 허용하므로, AI 제품을 내재화하려는 국내 기업에게 실질적인 선택지가 된다.

전체 보기

Article

2026년 3월 30일

Mistral Small 4 (22B), 오픈소스 추론 벤치마크 1위 — 자기 3~5배 규모 클로즈드 모델 추월

📌 핵심 요약 프랑스 Mistral AI가 공개한 22B 파라미터의 Mistral Small 4가 추론 및 지시 수행 벤치마크에서 자신보다 3~5배 큰 클로즈드 모델들을 앞질렀다. Apache 2.0 라이선스로 제공되며 상업적 이용도 자유롭다. 🔍 왜 주목해야 하나 22B 모델이 60B~100B급 클로즈드 모델과 동급이거나 우세하다는 것은 오픈소스 진영의 기술력이 클로즈드 생태계를 본격적으로 위협하는 변곡점이다. Mistral은 이미 Mixtral-8x7B(2023)로 GPT-3.5를 넘어선 바 있으며, Small 4는 그 연장선에서 추론 능력(reasoning) 특화 모델의 새 기준을 세운 것이다. 유럽산 오픈소스 모델로서 GDPR 규정 준수와 자체 호스팅이 용이한 점도 차별점이다. ⚡ 실무 시사점 복잡한 추론이 필요한 에이전트 파이프라인(RAG, Tool Use, 멀티스텝 계획)을 구축 중이라면 Mistral Small 4를 기존 사용 모델의 벤치마크 대조군으로 즉시 테스트할 것. 특히 비용 민감한 유럽 규정 준수 환경에서 자체 호스팅 대안으로 검토 가치가 높다.

자동수집

Read Story

Article

2026년 3월 29일

Alibaba Qwen 3.5 Small 시리즈 출시: 9B 모델이 GPT 120B를 벤치마크에서 앞질러

📌 핵심 요약 Alibaba가 Qwen 3.5 Small 시리즈(0.8B·2B·4B·9B)를 Apache 2.0 라이선스로 오픈소스 공개했다. 9B 모델의 GPQA 점수 81.7로 OpenAI의 GPT-OSS-120B(71.5)를 벤치마크에서 앞질렀다. 🔍 왜 주목해야 하나 파라미터 수 대비 추론 성능의 효율이 극적으로 개선되고 있다는 증거다. 9B 모델이 120B를 이긴다는 것은 단순 스케일 경쟁이 무의미해졌음을 뜻하며, 엣지·온디바이스·비용 민감 환경에서의 고성능 LLM 배포 장벽이 사실상 사라지고 있다. Apache 2.0 라이선스로 상업적 사용이 완전히 자유롭다는 점도 기업 도입 관점에서 중요하다. ⚡ 실무 시사점 OpenAI·Anthropic API 비용이 부담인 팀이라면 Qwen 3.5 9B를 자체 호스팅하는 옵션을 즉시 검토할 것. 특히 반복적이고 구조화된 작업(분류, 추출, 요약)에서 성능·비용 최적점을 확인할 수 있다.

오픈소스

Read Story

Article

2026년 3월 27일

Mistral Small 4 출시 — 119B MoE, 추론·비전·코딩 통합 오픈소스 모델 (Apache 2.0)

📌 핵심 요약 Mistral AI가 2026년 3월 16일, 119B 파라미터 Mixture-of-Experts 아키텍처의 Mistral Small 4를 Apache 2.0 라이선스로 공개했다. 토큰당 활성 파라미터는 6B으로, 기존 Magistral(추론), Pixtral(비전), Devstral(에이전트 코딩) 세 모델의 기능을 하나로 통합했다. 🔍 왜 주목해야 하나 '하나의 오픈소스 모델로 세 가지 전문 모델을 대체'하는 것은 멀티모달 에이전트 운영의 복잡도를 드라마틱하게 낮춘다. 전작 대비 end-to-end 레이턴시 40% 감소, 처리량 3배 향상이라는 수치는 프로덕션 환경에서 직접적인 비용 절감을 의미하며, Apache 2.0 라이선스로 상업적 활용 제약이 없어 자체 인프라 위에 멀티모달 에이전트를 구축하려는 팀에게 현실적인 선택지가 됐다. ⚡ 실무 시사점 비전·코딩·추론을 아우르는 온프레미스 에이전트를 구축하려는 팀이라면 Mistral Small 4를 즉시 평가 대상에 올릴 것. 특히 데이터 주권이나 API 비용 절감이 중요한 엔터프라이즈 환경에서 GPT-4o, Gemini 1.5 Flash 대비 TCO 비교 검토 가치가 높다.

오픈소스

Read Story

Article

2026년 3월 26일

Alibaba Qwen 3.5 Small: 9B 모델이 GPT-oss-120B를 GPQA Diamond에서 추월

📌 핵심 요약 Alibaba가 0.8B, 2B, 4B, 9B 네 가지 크기의 Qwen 3.5 Small 시리즈를 Apache 2.0 라이선스로 공개했다. 텍스트, 이미지, 비디오를 네이티브 멀티모달로 처리하며, 9B 모델이 GPQA Diamond 벤치마크에서 81.7점을 기록해 GPT-oss-120B(71.5점)를 상회했다. 🔍 왜 주목해야 하나 파라미터 규모가 13배 이상 차이 나는 모델을 GPQA Diamond(대학원 수준 과학 추론 벤치마크)에서 앞서는 것은 소형 모델의 '인지 밀도(cognitive density)' 향상이 실질적 임계점에 도달했음을 보여준다. 멀티모달을 별도 어댑터 없이 단일 모델로 처리하고 Apache 2.0으로 자유롭게 사용 가능하다는 점에서 엣지 및 온디바이스 AI 배포 가능성이 대폭 확대된다. ⚡ 실무 시사점 비용 제약이 있는 환경에서 멀티모달 AI 기능이 필요하다면 Qwen 3.5-9B를 즉시 평가 파이프라인에 추가할 것을 권장한다. 특히 이미지·영상 이해가 필요한 엔터프라이즈 내부 도구 구축에 즉각 활용 가능하다.

자동수집

Read Story

RE-ENTRY

Alibaba Qwen 3.5 소형 모델 공개 — 9B 파라미터로 GPT-OSS-120B 능가, Apache 2.0 오픈소스

배경 및 맥락

핵심 내용

경쟁 구도 / 비교

의미

관련 글

Mistral Small 4 (22B), 오픈소스 추론 벤치마크 1위 — 자기 3~5배 규모 클로즈드 모델 추월

Alibaba Qwen 3.5 Small 시리즈 출시: 9B 모델이 GPT 120B를 벤치마크에서 앞질러

Mistral Small 4 출시 — 119B MoE, 추론·비전·코딩 통합 오픈소스 모델 (Apache 2.0)

Alibaba Qwen 3.5 Small: 9B 모델이 GPT-oss-120B를 GPQA Diamond에서 추월

최신 글 재진입