PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

읽을거리

2026년 4월 3일

Arcee Trinity-Large-Thinking 출시 — 미국계 오픈 에이전트 모델이 가격 대비 frontier 경쟁력 제시

Arcee AI가 2026년 4월 1일 Trinity-Large-Thinking을 공개했다. Apache 2.0 오픈웨이트 reasoning 모델로, long-horizon agent와 multi-turn tool calling에 초점을 맞췄고 PinchBench에서 Opus 4.6 바로 아래 2위를 기록했다고 밝혔다.

본문 읽기원문 보기

발행일

2026년 4월 3일

업데이트

2026년 4월 3일

주제

AI
모델
오픈소스
API
트렌드
원문 보기

배경 및 맥락

오픈웨이트 모델 시장은 2025년 이후 중국계 모델이 성능과 공개 속도에서 강한 존재감을 보였고, 미국계 스타트업은 상대적으로 존재감이 약했다. 동시에 개발자들은 단순 채팅 벤치마크보다 장시간 에이전트 루프, 다중 도구 호출, 문맥 유지 같은 실제 운영 성능을 더 중시하기 시작했다.

Arcee는 이런 수요를 겨냥해 Trinity 계열을 키워 왔고, 이번 Large-Thinking은 그 전략의 본게임에 가깝다. 회사는 이를 “developers and enterprises can actually own”할 수 있는 permissive American open model로 포지셔닝하며, 오픈 모델 경쟁을 지정학·소유권·비용 구조의 문제까지 확장했다.


핵심 내용

공식 발표에 따르면 Trinity-Large-Thinking은 complex, long-horizon agents와 multi-turn tool calling용 reasoning 모델이며 Apache 2.0 라이선스로 API와 Hugging Face weights를 함께 공개했다. Arcee는 Preview 대비 SFT와 RL 파이프라인을 강화해 thinking-before-responding 구조를 넣었고, 그 결과 multi-turn tool use, context coherence, instruction following이 개선됐다고 설명한다.

수치도 공격적이다. Arcee는 Trinity Large Preview가 출시 후 2개월 동안 OpenRouter에서 3.37 trillion tokens를 처리했고, 미국 내 #1 오픈 모델, 글로벌 #4 사용량을 기록했다고 밝혔다. Large-Thinking 본 모델은 PinchBench에서 Opus 4.6 바로 아래 2위를 기록했고, API 가격은 output token 기준 백만 개당 0.90달러로 제시됐다. 회사 주장대로면 이는 유사한 에이전트 작업에서 폐쇄형 frontier 모델보다 훨씬 낮은 비용 구조를 뜻한다.


경쟁 구도 / 비교

최근 오픈 모델 다수가 범용 reasoning이나 coding benchmark를 강조한 반면, Trinity-Large-Thinking은 에이전트 운영 성능을 전면에 둔다. 즉, “얼마나 똑똑한가”보다 “긴 세션에서 얼마나 덜 무너지는가”를 판별 축으로 삼는다. 이 포지션은 Qwen·Mistral 계열과도 다르고, Claude Opus·GPT 계열과는 가격·소유권 면에서 정면 경쟁한다.

또 하나의 차별점은 라이선스와 소유권이다. Apache 2.0 오픈웨이트는 기업이 직접 호스팅, 후처리, distill, 내부 규제 환경에 맞춘 재배포를 검토할 수 있게 만든다. 폐쇄형 API 모델이 성능에서 앞서더라도, 데이터 통제와 단가 압박이 큰 조직에서는 충분히 비교 대상이 된다.


의미

Trinity-Large-Thinking은 오픈 모델 시장이 더 이상 “폐쇄형 대비 싼 대체재”에 머물지 않고, 특정 워크로드에서는 실무 우선 후보가 될 수 있음을 보여준다. 특히 agent backend 비용이 누적되는 팀에게는 모델 선택이 곧 unit economics 문제가 된다.

다만 실전 도입에서는 벤치마크 숫자만 볼 수 없다. 장시간 세션 안정성, 도구 호출 실패율, 장애 대응, 모델 업데이트 주기, 공급자 지속 가능성까지 함께 검토해야 한다. 그럼에도 이번 출시는 오픈 에이전트 모델이 가격과 제어권 측면에서 본격적인 협상력을 갖기 시작했다는 점에서 의미가 크다.

이어 읽기

관련 읽을거리

전체 보기
2026년 4월 5일Google Gemma 4 공개 — Apache 2.0·256K 컨텍스트·멀티모달, 오픈 에이전틱 모델의 새 기준Google이 4월 2~3일 Gemma 4를 Apache 2.0 라이선스로 공개했다. Effective 2B·4B·26B MoE·31B Dense 네 가지 크기로 제공되며, 256K 토큰 컨텍스트, 비전·오디오 네이티브 멀티모달, 140개 이상 언어를 지원한다.2026년 4월 3일Gemma 4 공개 — Apache 2.0 오픈 모델을 agentic workflow 중심으로 재정의Google DeepMind가 2026년 4월 2일 Gemma 4를 공개했다. E2B, E4B, 26B MoE, 31B Dense 네 가지 크기로 출시됐고, Apache 2.0 라이선스 아래 reasoning, function calling, JSON output, vision/audio 입력까지 지원한다.2026년 4월 1일NVIDIA Nemotron 3 Super — 120B MoE 오픈소스 에이전트 모델, SWE-Bench 60.5% 달성NVIDIA가 에이전트 워크로드 특화 오픈소스 모델 Nemotron 3 Super를 공개했다. Mamba-Transformer 하이브리드 MoE 아키텍처로 원래 1,200억 파라미터에서 활성 파라미터 120억만 사용, SWE-Bench Verified 60.47% 및 PinchBench 85.6%로 동급 오픈소스 최고 성능을 기록했다.2026년 4월 1일OpenAI, 최초 오픈웨이트 모델 gpt-oss-120b 공개 — Apache 2.0, o4-mini 수준 추론 성능OpenAI가 처음으로 오픈웨이트 모델인 gpt-oss-120b(117B 파라미터, MoE)와 gpt-oss-20b를 Apache 2.0 라이선스로 공개했다. 단일 80GB GPU에서 실행 가능하며, 코딩·수학·툴 사용에서 o4-mini와 동등하거나 일부 초과한다.