글
Browser Harness - LLM 기반 자가치유 브라우저 자동화 프레임워크
Browser Harness는 LLM이 Chrome DevTools Protocol(CDP)을 통해 브라우저 작업을 직접 수행하되, 필요한 헬퍼 코드를 실행 중 스스로 생성하는 자가치유(self-healing) 자동화 프레임워크다. 핵심 코드가 ~1,000줄에 불과한 초경량 구조. 🔍 왜 주목해야 하나: 기존 브라우저 자동화(Selenium, Playwright)는 미리 정의된 액션에…
배경 및 맥락
LLM 기반 브라우저 자동화는 2024~2025년 AI 에이전트 분야에서 가장 활발한 영역 중 하나다. Selenium, Playwright 같은 전통적 자동화 도구는 사전에 정의된 셀렉터와 액션에 의존하기 때문에, 웹사이트 구조가 바뀌면 스크립트가 깨지는 문제가 반복된다. Browser Use 팀은 이 문제를 근본적으로 해결하기 위해 "에이전트가 스스로 코드를 작성하는" 접근법을 택했다.
Browser Harness는 Browser Use 프로젝트(GitHub 스타 11.2k+)의 핵심 컴포넌트로, Chrome DevTools Protocol을 통해 브라우저에 직접 연결하고, 에이전트가 실행 중 필요한 헬퍼 함수를 즉석에서 생성하는 자가치유 아키텍처를 구현한다.
핵심 내용
아키텍처 구성:
프로젝트는 4개 핵심 파일로 구성되며, 전체 코드가 약 1,000줄에 불과하다. install.md(초기 셋업), src/browser_harness/(보호된 코어), agent-workspace/agent_helpers.py(에이전트가 수정 가능한 헬퍼), agent-workspace/domain-skills/(사이트별 스킬 모듈)로 나뉜다.
자가치유 메커니즘:
에이전트가 특정 웹사이트에서 작업 중 필요한 기능이 없으면, 직접 Python 헬퍼 코드를 작성해 agent_helpers.py에 추가한다. 이 코드는 이후 실행에서도 재사용되므로 시스템이 점점 더 많은 사이트를 다룰 수 있게 된다.
도메인 스킬 시스템:
GitHub, LinkedIn, Amazon 등 주요 사이트에 대한 사이트별 플레이북을 커뮤니티가 기여할 수 있다. 중요한 원칙은 스킬이 사람이 직접 작성하는 것이 아니라, 에이전트가 실제 브라우저 상호작용을 통해 생성해야 한다는 점이다.
클라우드 지원:
Browser Use Cloud를 통해 무료 티어(동시 3개 브라우저, 프록시 지원, 캡차 해결)를 제공하며, 헤드리스 배포와 스텔스 브라우저 모드도 지원한다.
경쟁 구도 및 비교
- Playwright/Selenium: 전통적 자동화. 정적 셀렉터 기반으로 유지보수 비용이 높음
- Browser Use (상위 프로젝트): Browser Harness의 모체. 더 높은 수준의 추상화 제공
- Skyvern: AI 기반 브라우저 자동화이지만 더 무거운 구조
- LaVague: 비슷한 LLM+브라우저 접근이지만 자가치유 메커니즘 없음
Browser Harness는 "얇은 레이어" 철학으로 차별화된다. 최소한의 중간 계층만 두고 에이전트가 CDP에 직접 접근하도록 해, 디버깅과 커스터마이징이 용이하다.
의미
Browser Harness는 AI 에이전트가 웹을 탐색하는 방식의 패러다임 전환을 보여준다. "미리 모든 것을 정의하는" 전통적 접근 대신, "필요할 때 스스로 만드는" 적응형 접근이 실용적으로 작동할 수 있음을 증명한다. Claude Code와의 자연스러운 통합은 Anthropic 생태계 사용자들에게 특히 매력적이며, MIT 라이선스로 상업적 활용도 자유롭다.