PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

읽을거리

2026년 5월 18일

Hermes Unlocks Self-Improving AI Agents, Powered by NVIDIA RTX PCs and DGX Spark — 로컬 에이전트 경쟁이 모델보다 orchestration 설계로 이동

NVIDIA는 2026년 5월 13일 Nous Research의 오픈소스 Hermes Agent를 소개하며, 이 프레임워크가 3개월도 안 돼 GitHub star 14만 개를 넘겼고 OpenRouter 기준 가장 많이 쓰이는 agent라고 설명했다. Hermes는 self-evolving skills, contained sub-agents, curated reliability를 내세우며…

본문 읽기원문 보기

발행일

2026년 5월 18일

업데이트

2026년 5월 18일

주제

AI
오픈소스
에이전트
트렌드
원문 보기

배경 및 맥락

오픈소스 agent 생태계는 한동안 더 큰 모델과 더 긴 context에 의존해 왔다. 하지만 실제 로컬 사용에서는 GPU 메모리, 지연시간, 장시간 실행 안정성, 민감 데이터 처리 같은 제약이 더 중요하다. 그래서 최근에는 모델 자체보다 작은 모델로도 꾸준히 잘 작동하게 만드는 orchestration 계층이 경쟁력이 되고 있다.

Hermes는 이런 흐름을 대표한다. NVIDIA가 이를 전면에 내세운 이유도 단순한 하드웨어 마케팅이 아니라, 로컬 에이전트가 실사용 단계로 진입하면서 orchestration과 하드웨어 최적화가 함께 묶여야 한다는 점을 보여주기 위해서다.


핵심 내용

NVIDIA blog에 따르면 Nous Research의 Hermes Agent는 3개월도 안 돼 GitHub star 14만 개를 넘겼고, OpenRouter 기준 가장 많이 쓰이는 agent가 됐다. Hermes의 차별점은 네 가지다. 첫째, self-evolving skills로 복잡한 작업이나 피드백에서 배운 내용을 skill로 저장해 스스로 개선한다. 둘째, contained sub-agents로 하위 작업을 짧고 격리된 worker로 나눠 더 작은 context window에서도 정돈된 실행을 유지한다. 셋째, shipping되는 skill과 tool을 사전 검증해 reliability를 높인다. 넷째, 같은 모델을 써도 thin wrapper가 아니라 orchestration layer 차이로 더 강한 결과를 만든다고 주장한다.

하드웨어와 모델 측면에서도 숫자가 인상적이다. NVIDIA는 Qwen 3.6 35B가 약 20GB 메모리로 이전 세대 120B 모델을 능가하고, Qwen 3.6 27B는 Qwen 3.5 397B급 정확도에 근접한다고 설명했다. DGX Spark는 128GB unified memory와 1 petaflop AI 성능으로 하루 종일 120B mixture-of-experts 모델을 돌릴 수 있다고 제시했다.


경쟁 구도 / 비교

로컬 에이전트 시장에서 기존 프레임워크 다수는 모델 호출과 툴 연결을 얇게 감싸는 수준에 그쳤다. Hermes는 skill persistence와 sub-agent isolation을 전면에 내세우며 계속 배우는 로컬 agent를 제품 개념으로 밀고 있다. 이는 단순 CLI agent나 일회성 task runner와 결이 다르다.

또한 이 발표는 오픈모델 경쟁에도 의미가 있다. 이전에는 고성능 agent를 위해 거대한 모델과 클라우드 인프라가 필요하다는 인식이 강했지만, 이제는 27B~35B급 open-weight 모델과 적절한 orchestration만으로도 상당한 수준의 agent UX를 만들 수 있다는 주장이 힘을 얻고 있다.


의미

산업적으로는 개인 장비와 소규모 워크스테이션이 다시 AI 실행 환경의 중요한 축으로 부상하고 있다. 클라우드가 유일한 답이 아니라, 데이터 주권과 지연시간을 중시하는 팀에게는 로컬 agent stack이 충분히 현실적인 대안이 되고 있다.

실무적으로는 로컬 agent 도입 시 모델 벤치마크보다 skill 저장 구조, sub-agent 경계, runtime 선택, 장시간 실행 안정성을 먼저 검토해야 한다. 앞으로 로컬 AI의 승부는 더 큰 모델보다 더 잘 설계된 orchestration에서 날 가능성이 높다.

이어 읽기

관련 읽을거리

전체 보기
2026년 5월 20일NVIDIA-Verified Agent Skills Provide Capability Governance for AI Agents — agent 확장성 경쟁이 capability supply chain 검증으로 이동NVIDIA는 2026년 5월 19일 agent skill에 transparency, security scanning, cryptographic signing, machine-readable skill card를 부여하는 NVIDIA-Verified Skills 체계를 공개했다. 검증된 skill은 cataloging, review, SkillSpector 스캔, signing,…2026년 4월 21일Agent Governance Toolkit — 에이전트 보안이 사후 감사에서 runtime kernel 계층으로 이동Microsoft는 2026년 4월 2일 Agent Governance Toolkit을 MIT 라이선스로 공개했다. 이 오픈소스 프로젝트는 OWASP Agentic AI Top 10의 10개 위험군을 모두 다루는 runtime governance stack을 목표로 하며, Agent OS·Mesh·Runtime·SRE·Compliance·Marketplace·Lightning의 7개…2026년 4월 8일awesome-design-md — AI 에이전트를 위한 디자인 시스템 컬렉션Google Stitch의 DESIGN 문서 개념을 바탕으로, 유명 서비스의 시각 언어를 Markdown으로 정리해 AI 코딩 에이전트가 유사한 UI를 구현하도록 돕는 오픈소스 컬렉션. 공식 디자인 시스템이 아니라 공개 웹사이트를 바탕으로 추출한 비공식 레퍼런스라는 점이 핵심이다.2026년 6월 25일Claude Tag - Slack-native team agents move from private assistants to shared workspacesAnthropic은 Slack에서 @Claude를 태그해 팀 단위로 작업을 위임하는 Claude Tag beta를 공개했다. Claude Enterprise와 Team 고객 대상이며, channel-scoped memory, tool/data/codebase access, ambient updates, spend limits, activity logs를 제공한다.