Feature Article
AutoAgent — 벤치마크로 에이전트 하네스를 스스로 개선하는 메타 에이전트
작업을 직접 해결하는 에이전트가 아니라, agent.py 하네스를 수정·평가·채택/폐기하며 성능을 끌어올리는 autonomous harness engineering 프로젝트.
Meta
Tags
개요
AutoAgent는 일반적인 개인 비서형 AI 에이전트가 아니라, 에이전트 하네스 자체를 더 잘 만들도록 설계된 메타 에이전트다.
핵심 아이디어
- 사람은 Python 하네스를 직접 고치기보다
program.md로 목표와 실험 루프를 정의 - 메타 에이전트는
agent.py를 수정하고 벤치마크를 돌린 뒤 점수가 오르면 유지, 아니면 폐기 - 즉 "에이전트가 에이전트를 개선"하는 구조
구조
agent.py: 단일 파일 하네스, 프롬프트/툴/오케스트레이션 편집 영역program.md: 인간이 수정하는 상위 지시문tasks/: Harbor 형식 벤치마크 태스크
현재 인상
- 개념은 강하지만 레포는 아직 매우 초기 상태
- 기본 하네스가 단순해서, 바로 범용 실행 에이전트로 쓰기보다는 연구/실험용 출발점에 가까움
비교 포지션
- OpenClaw/NanoClaw: 개인 비서형 런타임
- gstack: 코딩 워크플로 운영 레이어
- AutoAgent: 벤치마크 기반 하네스 최적화 루프
한줄 정리
에이전트를 쓰는 도구가 아니라, 에이전트를 더 잘 만들게 하는 도구.