PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

읽을거리

2026년 5월 19일

Gemini 3.5 Flash — Google이 agentic coding의 기본 축을 모델+하네스 결합으로 재정의

Google은 2026년 5월 19일 Gemini 3.5 Flash를 공개하며 Gemini app, AI Mode in Search, Google Antigravity, Gemini API, Android Studio, Gemini Enterprise Agent Platform 전반에 즉시 배포했다. Google은 이 모델이 Terminal-Bench 2.1 76.2%, GDPval-AA…

본문 읽기원문 보기

발행일

2026년 5월 19일

업데이트

2026년 5월 19일

주제

AI
Gemini
모델
트렌드
원문 보기

배경 및 맥락

지난 1년간 모델 경쟁은 더 높은 reasoning 점수와 더 긴 context window를 전면에 내세웠지만, 실제 제품 경쟁은 점점 agent가 얼마나 현실적인 작업을 끝까지 수행하느냐로 이동해 왔다. 이 단계에서는 모델 하나의 품질만으로는 부족하고, 멀티스텝 실행을 관리하는 하네스, 하위 agent 협업 구조, 그리고 개발자에게 바로 연결되는 배포 표면이 함께 필요하다.

Google은 이번 I/O 2026 발표에서 이 점을 노골적으로 드러냈다. Gemini 3.5 Flash 자체의 성능뿐 아니라 Antigravity, AI Studio, Android Studio, Gemini app, Search, Enterprise platform을 한 번에 묶어 내놓으면서 agentic stack을 제품화된 시스템으로 제시했다.


핵심 내용

공식 발표에 따르면 Gemini 3.5 Flash는 2026년 5월 19일부터 일반 사용자, 개발자, 기업 고객에게 동시에 제공된다. Google은 이 모델이 Terminal-Bench 2.1에서 76.2%, GDPval-AA에서 1656 Elo, MCP Atlas에서 83.6%, CharXiv Reasoning에서 84.2%를 기록했다고 설명했다. 또한 Gemini 3.1 Pro보다 대부분의 벤치마크에서 우위에 있으면서도 다른 frontier 모델 대비 4배 빠른 속도를 제공한다고 주장했다.

중요한 부분은 모델 배치 방식이다. 3.5 Flash는 Google Antigravity와 결합해 collaborative subagent workflow를 처리하고, 코드베이스 현대화나 멀티스텝 앱 제작 같은 long-horizon 작업을 수행하도록 설계됐다. Google은 이를 Search의 AI Mode, Gemini app, Android Studio, Gemini API, Enterprise Agent Platform까지 연결했다.


경쟁 구도 / 비교

OpenAI와 Anthropic이 코딩 에이전트와 managed runtime, connector 계층을 강화하는 동안, Google은 이번에 모델과 실행 하네스를 동시에 전면에 내세웠다. 이는 단순히 더 좋은 모델을 제공하는 전략보다, 더 넓은 product surface에서 같은 agentic core를 재사용하려는 접근에 가깝다.

또한 Flash 라인업이 frontier 성능과 속도를 함께 잡았다는 주장은 고가의 최고급 모델만이 agent를 돌릴 수 있다는 인식을 흔든다. 빠른 모델이 충분한 품질을 내면, 실제 도입 결정은 latency·비용·통합 편의성에서 크게 갈릴 수 있다.


의미

산업적으로는 모델 경쟁이 점점 execution platform 경쟁으로 바뀌고 있다. 어느 회사가 더 높은 점수를 내느냐보다, 어떤 하네스와 배포 표면으로 agent를 실제 업무 안에 밀어 넣느냐가 더 중요해지고 있다.

실무적으로는 제품팀과 플랫폼팀이 모델 교체만으로 AI 전략을 설명하기 어려워졌다. 앞으로는 subagent 구조, 앱/검색/IDE 연계, 비용 대비 처리량, 안전장치까지 포함한 end-to-end 설계를 비교해야 한다.

이어 읽기

관련 읽을거리

전체 보기
2026년 4월 12일Gemma 4 공개 — Google이 open model 전략을 Apache 2.0과 on-device 배포로 다시 밀어붙이다Google DeepMind는 2026년 4월 2일 Gemma 4를 공개했다. 새 라인업은 E2B, E4B, 26B MoE, 31B Dense 네 가지 크기로 구성되며 Apache 2.0 라이선스로 배포되고, 31B 모델은 Arena 기준 당시 세계 오픈 모델 3위, 26B 모델은 6위라고 밝혔다.2026년 4월 5일Google Gemma 4 공개 — Apache 2.0·256K 컨텍스트·멀티모달, 오픈 에이전틱 모델의 새 기준Google이 4월 2~3일 Gemma 4를 Apache 2.0 라이선스로 공개했다. Effective 2B·4B·26B MoE·31B Dense 네 가지 크기로 제공되며, 256K 토큰 컨텍스트, 비전·오디오 네이티브 멀티모달, 140개 이상 언어를 지원한다.2026년 4월 4일Google Gemini 3.1 Flash Live 공개 — 실시간 음성 에이전트용 오디오 모델, ComplexFuncBench Audio 90.8%Google은 2026년 3월 26일 Gemini 3.1 Flash Live를 공개하며 실시간 음성 대화용 모델을 Live API preview로 제공하기 시작했다. Google 발표에 따르면 이 모델은 ComplexFuncBench Audio에서 90.8%, Audio MultiChallenge에서 36.1%를 기록하며 다단계 함수 호출과 장기 오디오 추론 성능을 끌어올렸다.2026년 4월 2일Google Gemini 3.1 Flash-Lite 출시 — Pro 대비 1/8 가격에 Gemini 2.5 Flash 동등 성능Google이 Gemini 3.1 Flash-Lite를 개발자 프리뷰로 출시했다. 입력 $0.25/1M 토큰(Pro의 1/8 수준), 출력 $1.50/1M 토큰이며, Gemini 2.5 Flash 대비 Time to First Token 2.5배 향상, 출력 속도 45% 향상을 달성하면서 핵심 성능 지표에서는 Gemini 2.5 Flash와 동등하다.