PickleeAI와 개발에 대한 짧은 노트
홈아티클아카이브검색

끝까지 읽는 글

AI와 개발에 관한 변화 중에서 블로그처럼 오래 읽을 수 있는 글만 골라 정리합니다.

© 2026 Picklee

RSSSitemap

글

2026년 5월 7일수정 2026년 5월 7일원문

Browser Harness - LLM 기반 자가치유 브라우저 자동화 프레임워크

Browser Harness는 LLM이 Chrome DevTools Protocol(CDP)을 통해 브라우저 작업을 직접 수행하되, 필요한 헬퍼 코드를 실행 중 스스로 생성하는 자가치유(self-healing) 자동화 프레임워크다. 핵심 코드가 ~1,000줄에 불과한 초경량 구조. 🔍 왜 주목해야 하나: 기존 브라우저 자동화(Selenium, Playwright)는 미리 정의된 액션에…

AI
오픈소스
에이전트
개발도구
Claude

배경 및 맥락

LLM 기반 브라우저 자동화는 2024~2025년 AI 에이전트 분야에서 가장 활발한 영역 중 하나다. Selenium, Playwright 같은 전통적 자동화 도구는 사전에 정의된 셀렉터와 액션에 의존하기 때문에, 웹사이트 구조가 바뀌면 스크립트가 깨지는 문제가 반복된다. Browser Use 팀은 이 문제를 근본적으로 해결하기 위해 "에이전트가 스스로 코드를 작성하는" 접근법을 택했다.

Browser Harness는 Browser Use 프로젝트(GitHub 스타 11.2k+)의 핵심 컴포넌트로, Chrome DevTools Protocol을 통해 브라우저에 직접 연결하고, 에이전트가 실행 중 필요한 헬퍼 함수를 즉석에서 생성하는 자가치유 아키텍처를 구현한다.

핵심 내용

아키텍처 구성:

프로젝트는 4개 핵심 파일로 구성되며, 전체 코드가 약 1,000줄에 불과하다. install.md(초기 셋업), src/browser_harness/(보호된 코어), agent-workspace/agent_helpers.py(에이전트가 수정 가능한 헬퍼), agent-workspace/domain-skills/(사이트별 스킬 모듈)로 나뉜다.

자가치유 메커니즘:

에이전트가 특정 웹사이트에서 작업 중 필요한 기능이 없으면, 직접 Python 헬퍼 코드를 작성해 agent_helpers.py에 추가한다. 이 코드는 이후 실행에서도 재사용되므로 시스템이 점점 더 많은 사이트를 다룰 수 있게 된다.

도메인 스킬 시스템:

GitHub, LinkedIn, Amazon 등 주요 사이트에 대한 사이트별 플레이북을 커뮤니티가 기여할 수 있다. 중요한 원칙은 스킬이 사람이 직접 작성하는 것이 아니라, 에이전트가 실제 브라우저 상호작용을 통해 생성해야 한다는 점이다.

클라우드 지원:

Browser Use Cloud를 통해 무료 티어(동시 3개 브라우저, 프록시 지원, 캡차 해결)를 제공하며, 헤드리스 배포와 스텔스 브라우저 모드도 지원한다.

경쟁 구도 및 비교

  • Playwright/Selenium: 전통적 자동화. 정적 셀렉터 기반으로 유지보수 비용이 높음
  • Browser Use (상위 프로젝트): Browser Harness의 모체. 더 높은 수준의 추상화 제공
  • Skyvern: AI 기반 브라우저 자동화이지만 더 무거운 구조
  • LaVague: 비슷한 LLM+브라우저 접근이지만 자가치유 메커니즘 없음

Browser Harness는 "얇은 레이어" 철학으로 차별화된다. 최소한의 중간 계층만 두고 에이전트가 CDP에 직접 접근하도록 해, 디버깅과 커스터마이징이 용이하다.

의미

Browser Harness는 AI 에이전트가 웹을 탐색하는 방식의 패러다임 전환을 보여준다. "미리 모든 것을 정의하는" 전통적 접근 대신, "필요할 때 스스로 만드는" 적응형 접근이 실용적으로 작동할 수 있음을 증명한다. Claude Code와의 자연스러운 통합은 Anthropic 생태계 사용자들에게 특히 매력적이며, MIT 라이선스로 상업적 활용도 자유롭다.

더 읽기

같이 읽어볼 만한 글

전체 글 보기
2026년 5월 1일

Warp is now open-source — ADE 경쟁이 제품 기능에서 오픈 에이전트 운영체제로 확장

Warp는 2026년 4월 28일 Warp client를 AGPL로 오픈소스화하고, Oz 기반 agent-first 기여 워크플로를 공개했다. 동시에 Kimi·MiniMax·Qwen 지원 확대, auto (open) 모델 라우팅, 설정 파일 추가로 IDE/ADE를 더 개방형 표면으로 재구성했다. 🔍 왜 주목해야 하나 이 발표의 핵심은 오픈소스화 자체보다도 "agent가 구현을 맡고,…

2026년 4월 30일

An update on recent Claude Code quality reports — 에이전트 품질 경쟁이 모델 성능만이 아니라 제품 레이어 운영 규율로 이동

Anthropic은 2026년 4월 23일 Claude Code 품질 저하 보고에 대한 사후분석을 공개했다. 원인은 모델 열화가 아니라 제품 레이어의 세 가지 변경으로, 기본 reasoning effort를 high에서 medium으로 낮춘 결정, 1시간 이상 idle 세션에서 thinking history를 반복 삭제한 캐시 버그, 그리고 4월 16일 도입했다가 4월 20일 되돌린…

2026년 4월 14일

Open Agents — Vercel용 백그라운드 코딩 에이전트 레퍼런스 앱

Open Agents는 Vercel 위에서 백그라운드 코딩 에이전트를 만들고 실행하기 위한 오픈소스 레퍼런스 앱이다. 웹 UI, 에이전트 런타임, 샌드박스 오케스트레이션, GitHub 연동까지 함께 제공해 프롬프트에서 실제 코드 변경과 저장소 작업으로 이어지는 흐름을 한 저장소 안에서 보여준다. 이 링크가 볼 만한 이유는 에이전트와 샌드박스를 분리한 구조를 비교적 선명하게 드러내기…

2026년 4월 14일

TypeUI - AI 에이전트용 디자인 레이어 CLI

TypeUI는 AI가 생성한 UI 코드 위에 일관된 시각 규칙을 덧입히기 위한 CLI이자 디자인 스킬 레지스트리다. pull·generate·update 흐름으로 스킬을 프로젝트에 주입하고, 무료 스킬과 상용 기능을 함께 제공한다. AI 코딩의 문제를 단순히 더 많이 생성하는 것이 아니라, 여러 에이전트와 작업자가 섞여도 같은 시각 언어를 유지하게 만드는 데 초점을 둔 도구라는 점이…