PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

읽을거리

2026년 7월 3일

GitHub Copilot Browser Tools GA - coding agents get controlled live-browser execution in VS Code

GitHub이 VS Code용 Copilot Browser Tools를 GA로 전환했다. Copilot agents는 이제 실제 브라우저를 열고 navigate, click, type, hover, drag, dialog handling, console error 확인, screenshot capture, scripted flow 실행을 수행할 수 있다.

본문 읽기원문 보기

발행일

2026년 7월 3일

업데이트

2026년 7월 3일

주제

AI
개발도구
에이전트
원문 보기

배경 및 맥락

AI coding assistant는 completion과 chat에서 repository-aware agent로 이동했고, 최근에는 실제 제품 표면을 실행하고 검증하는 단계까지 확장되고 있다. 프론트엔드와 풀스택 개발에서는 코드 diff가 맞아도 로그인, 권한, 네트워크, 브라우저 API, layout 상태가 틀리면 기능은 실패한다.

GitHub Copilot Browser Tools의 GA는 이 흐름을 VS Code 안으로 끌어온 사건이다. agent가 브라우저를 직접 조작하고 관찰할 수 있어야 코드 수정과 실제 사용자 흐름 검증 사이의 루프가 짧아진다.


핵심 내용

GitHub은 2026년 7월 1일 Browser tools for GitHub Copilot in VS Code를 generally available로 발표했다. agent는 페이지 열기, navigation, click, type, hover, drag, dialog handling을 수행할 수 있고, page content, console errors, screenshots도 읽을 수 있다. 반복적인 sequence는 scripted flow로 실행할 수 있다.

보안과 제어도 함께 설계됐다. 사용자가 직접 연 탭은 기본적으로 비공개이며 Share with Agent를 선택해야 agent가 접근할 수 있다. agent가 연 탭은 fresh session으로 격리되고, camera, microphone, location, notifications, clipboard reads 같은 민감 권한은 사용자의 명시적 승인 없이는 부여되지 않는다. Enterprise admin은 workbench.browser.enableChatTools와 network domain allow/deny controls로 사용 범위를 관리할 수 있다.


경쟁 구도 / 비교

Google Gemini Computer Use, Claude Code/Claude Tag, OpenAI Codex 계열 모두 agent가 외부 tool surface와 상호작용하는 방향으로 움직이고 있다. 차이는 GitHub이 이를 일반 브라우저 자동화가 아니라 IDE 내부의 개발 workflow와 enterprise policy에 붙여 배포한다는 점이다.

Playwright나 Cypress는 deterministic test automation에 강하지만, Copilot Browser Tools는 agent가 문제를 관찰하고 다음 행동을 결정하는 interactive debugging surface에 가깝다. 따라서 기존 테스트를 대체한다기보다, 실패 재현과 exploratory verification을 agent에게 맡기는 계층으로 보는 편이 정확하다.


의미

코딩 agent의 생산성은 점점 “코드를 생성했는가”보다 “실제 앱에서 문제를 재현하고 고쳤는가”로 평가될 것이다. 브라우저 조작, console inspection, screenshot evidence가 IDE에 기본 편입되면 PR 리뷰와 QA 핸드오프에서 요구되는 증거 수준도 올라간다.

실무 팀은 agent browser access를 무조건 켜기보다 허용 도메인, 민감 권한, 세션 격리, 기록 보관 방식을 먼저 정해야 한다. 특히 사내 관리자 페이지나 고객 데이터가 있는 환경에서는 agent가 접근 가능한 origin과 credential boundary를 명확히 문서화해야 한다.

이어 읽기

관련 읽을거리

전체 보기
2026년 7월 3일ScarfBench - enterprise Java migration exposes coding-agent behavior gapsIBM Research가 Hugging Face에 ScarfBench를 공개했다. ScarfBench는 Spring, Jakarta EE, Quarkus 사이의 enterprise Java framework migration을 평가하며 34개 앱, 102개 framework implementations, 204개 migration tasks, 약 151K LOC, 1,331개…2026년 6월 30일X hosted MCP - social data APIs become agent-native infrastructureX가 https://api.x.com/mcp와 https://docs.x.com/mcp 형태의 hosted MCP 서버를 공개해 Cursor, Claude, Grok Build, VS Code 같은 MCP 클라이언트가 X API와 문서를 직접 사용할 수 있게 했다.2026년 6월 28일Gemini 3.5 Flash Computer Use - screen-driving agents move into the main modelGoogle은 2026년 6월 24일 computer use를 Gemini 3.5 Flash의 built-in tool로 통합해, Gemini API와 Gemini Enterprise Agent Platform에서 browser, mobile, desktop 환경을 조작하는 agent를 만들 수 있게 했다. Gemini API 문서는 gemini-3.5-flash를 computer use…2026년 6월 25일Microsoft AutoJack - browsing agents expose local MCP control planes to RCEMicrosoft Defender Security Research Team은 AutoGen Studio 개발 빌드에서 browsing agent가 악성 웹페이지를 렌더링하면 local MCP WebSocket을 통해 host process를 실행할 수 있는 AutoJack chain을 공개했다. 이 chain은 localhost origin trust, MCP path auth…