배경 및 맥락
지금까지 모바일 AI 통합은 대체로 앱 안에 챗 UI를 넣거나, 앱 바깥에서 음성 비서를 붙이는 식이었다. 하지만 이런 방식은 실제 사용자의 작업 완료까지 이어지기 어렵고, 앱 기능이 구조화되지 않으면 에이전트도 결국 화면을 우회적으로 조작해야 한다. Google은 이번 발표에서 Android 자체를 사용자의 의도를 해석하고 앱 capability를 호출하는 실행 계층으로 끌어올리려는 방향을 분명히 했다.
핵심 내용
공식 블로그에 따르면 Gemini Intelligence는 selected app들에서 다단계 작업을 자동화하며, AppFunctions는 앱이 서비스·데이터·액션을 자연어 설명과 함께 OS 및 agent에 노출하도록 한다. Google은 KakaoTalk를 포함한 초기 private preview 사례를 언급했고, 로컬 실행 방식으로 25개 앱 use case가 이미 동작 중이라고 밝혔다. 또한 이 프레임은 휴대폰에만 머무르지 않고 foldable, watch, car, XR glasses까지 확대될 예정이다.
경쟁 구도 / 비교
이 접근은 기존 mobile assistant 전략과 다르다. 단순 deep link나 intent 호출보다 더 높은 수준의 semantic action exposure가 필요하고, 앱이 agent에게 어떤 기능을 어떻게 위임할지 직접 설계해야 한다. Apple과 다른 플랫폼도 유사한 흐름을 보일 가능성이 크지만, Google은 Android form factor 전반에 같은 실행 모델을 깔아 OS-level distribution advantage를 먼저 확보하려 한다.
의미
산업적으로는 앱 경제의 인터페이스가 아이콘과 화면에서 capability registry와 execution policy로 이동하는 신호다. 실무적으로는 모바일 팀이 앞으로 agent-safe action 설계, confirmation UX, observability, abuse 방지까지 제품 스펙에 포함해야 한다. Android에서 먼저 자리 잡으면 검색 최적화 다음 단계의 경쟁력은 agent invocation 최적화가 될 가능성이 높다.