글
Twin - AI 웹 자동화 에이전트
API 없이 웹 브라우저를 제어해 작업 자동화하는 AI 에이전트. 목표만 설정하면 스스로 경로 탐색, 버튼 클릭, 정보 입력. UI 변경 시 자동 적응. 베타 기간 4만+ 태스크, 9000+ 앱 지원. Qonto(50만 고객) 파트너십. OpenAI CUA 알파 테스터 15개사 중 하나.
배경 및 맥락
2024년 이후 AI 에이전트 기술이 빠르게 진화하면서, 단순 텍스트 생성을 넘어 실제 웹 상의 작업을 자동화하려는 수요가 급증했다. OpenAI의 Computer-Using Agent(CUA) 발표, Claude Code의 성공, Google의 Gemini 2.0 멀티모달 에이전트 공개 등 major AI 회사들이 에이전트 기술에 투자하고 있다. 이 배경에서 Twin은 API 없이 순수 웹 UI 자동화만으로 9,000개 이상의 앱을 지원하는 플랫폼으로 등장해 업계의 주목을 받고 있다. 기존 RPA나 웹 자동화 도구들이 API 통합이나 복잡한 설정을 요구하는 것과 달리, Twin은 사람이 웹에서 하는 모든 작업을 AI가 자동으로 수행할 수 있는 경험을 제공하는 것을 목표로 한다.
핵심 내용
기술 아키텍처
Twin은 LLM 기반 비전 모델과 웹 요소 감지(DOM 파싱) 기술을 결합한 하이브리드 방식을 사용한다. 사용자가 설정한 **목표(goal)**를 받으면, 현재 페이지의 시각적 정보와 구조를 분석해 다음 액션을 결정한다. 단순 시나리오 자동화가 아닌 동적 UI 적응(Dynamic Adaptation)이 핵심으로, UI가 변경되어도 의도만 일관되게 유지하면 자동으로 경로를 재탐색한다.
성과 지표
- 베타 기간 동안 4만 건 이상의 태스크 완료: 실제 프로덕션 환경에서의 안정성 검증
- 9,000개 이상의 앱 지원: Zapier(10년 걸려 구축한 규모)에 필적하는 통합 범위
- OpenAI CUA 알파 테스터 15개사 중 1개: OpenAI의 Computer-Using Agent 개발 과정에 파트너로 포함
- Qonto와의 공식 파트너십: 유럽 핀테크 Qonto(50만 고객)의 자동화 솔루션 제공
주요 기능 상세
자율 웹 네비게이션: 사용자가 "리포트를 이메일로 보내줘" 같은 자연어 지시만 주면, Twin이 웹을 돌아다니며 필요한 버튼을 찾고, 폼을 채우고, 서브밋 버튼을 누른다. 이는 단순 반복 매크로가 아닌 진정한 **의도 기반 자동화(Intent-Driven Automation)**다.
학습 기능: 매 실행마다 패턴을 학습해 유사한 작업은 점점 더 빠르고 정확하게 수행하게 된다. 이는 전통적 RPA 도구의 정적인 스크립트 방식과 근본적으로 다르다.
Error Handling & Recovery: 로딩 지연, 팝업, 예상치 못한 UI 변경 등의 상황에서도 자동으로 복구 경로를 찾아 작업을 완료한다.
경쟁 구도 / 비교
| 구분 | Twin | Zapier | 전통 RPA(UiPath) | OpenAI CUA |
|---|---|---|---|---|
| 통합 방식 | 웹 UI 자동화만 | API + Webhook | 정적 스크립트 | 비전 + DOM 파싱 |
| 설정 복잡도 | 매우 낮음 (자연어) | 중간 (Zap 구성) | 높음 (스크립팅) | 중간 |
| 앱 지원 범위 | 9,000+ | 7,000+ | 제한적 | 개발 중 |
| UI 변경 적응 | 자동 | 수동 재설정 | 수동 재설정 | 자동 |
| 학습/진화 | 지원 | 미지원 | 미지원 | 개발 중 |
Twin의 차별점은 API 없이 순수 UI 레이어로 모든 앱을 다룬다는 것이다. Zapier는 통합이 되어야 하고, UiPath 같은 RPA는 스크립트를 짜야 하지만, Twin은 목표만 말하면 된다. 이는 "매번 새로운 앱이 나와도 추가 개발 없이 자동으로 지원 가능"이라는 뜻이다.
의미
Twin은 에이전트 시대의 RPA 민주화를 상징한다. 기존 RPA는 enterprise 고객 대상 고가 솔루션이었으나, Twin은 개별 운영팀, 프리랜서, 스타트업도 사용할 수 있는 수준의 접근성을 제공한다. OpenAI CUA 테스터 선정, Qonto 파트너십 등은 "웹 자동화의 미래는 AI 에이전트"라는 산업 합의를 보여준다.
장기적으로는 Twin 같은 도구가 보편화되면, "자동화 가능한 반복 업무"의 정의 자체가 바뀔 것으로 예상된다. 현재는 API 통합 여부가 자동화 가능성을 좌우하지만, AI가 UI를 직접 제어할 수 있다면 모든 웹 앱이 자동화 대상이 되는 것이다. 이는 운영 효율성뿐 아니라 조직 설계와 인력 배치 방식의 재구성으로까지 이어질 수 있다.