읽을거리

2026년 4월 5일

AutoAgent — 벤치마크로 에이전트 하네스를 스스로 개선하는 메타 에이전트

작업을 직접 해결하는 에이전트가 아니라, agent.py 하네스를 수정·평가·채택/폐기하며 성능을 끌어올리는 autonomous harness engineering 프로젝트.

본문 읽기 원문 보기

개요

AutoAgent는 일반적인 개인 비서형 AI 에이전트가 아니라, 에이전트 하네스 자체를 더 잘 만들도록 설계된 메타 에이전트다.

핵심 아이디어

사람은 Python 하네스를 직접 고치기보다 program.md로 목표와 실험 루프를 정의
메타 에이전트는 agent.py를 수정하고 벤치마크를 돌린 뒤 점수가 오르면 유지, 아니면 폐기
즉 "에이전트가 에이전트를 개선"하는 구조

구조

agent.py: 단일 파일 하네스, 프롬프트/툴/오케스트레이션 편집 영역
program.md: 인간이 수정하는 상위 지시문
tasks/: Harbor 형식 벤치마크 태스크

현재 인상

개념은 강하지만 레포는 아직 매우 초기 상태
기본 하네스가 단순해서, 바로 범용 실행 에이전트로 쓰기보다는 연구/실험용 출발점에 가까움

비교 포지션

OpenClaw/NanoClaw: 개인 비서형 런타임
gstack: 코딩 워크플로 운영 레이어
AutoAgent: 벤치마크 기반 하네스 최적화 루프

한줄 정리

에이전트를 쓰는 도구가 아니라, 에이전트를 더 잘 만들게 하는 도구.

이어 읽기

관련 읽을거리