PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

읽을거리

2026년 5월 20일

Introducing RAMPART and Clarity — agent 안전이 보안 리뷰에서 CI와 설계 산출물로 이동

Microsoft는 2026년 5월 20일 RAMPART와 Clarity를 오픈소스로 공개했다. RAMPART는 adversarial 및 benign 시나리오를 pytest 기반 반복 테스트로 작성해 CI에 넣는 agent safety 테스트 프레임워크이고, Clarity는 문제 정의·실패 분석·의사결정을 .clarity-protocol/ Markdown 산출물로 남기는 structured…

본문 읽기원문 보기

발행일

2026년 5월 20일

업데이트

2026년 5월 20일

주제

AI
개발도구
에이전트
오픈소스
원문 보기

배경 및 맥락

agent는 이제 단순 응답 생성이 아니라 이메일 조회, CRM 기록 접근, 코드 실행, 외부 시스템 조작처럼 실제 행동을 수행한다. 이 단계에서는 기존 LLM 품질 평가만으로는 충분하지 않고, 설계 단계의 권한 판단과 배포 단계의 반복 가능한 안전 테스트가 함께 필요하다. 하지만 많은 조직에서 AI safety는 여전히 별도 리뷰나 red-team engagement에 머물러 있어 개발 흐름과 분리돼 있었다.


핵심 내용

Microsoft는 두 개의 상보적 도구를 공개했다. RAMPART는 PyRIT 위에 구축된 오픈소스 agent safety 테스트 프레임워크로, 팀이 threat model 기반 시나리오를 표준 pytest 테스트로 작성해 CI에서 반복 실행할 수 있게 한다. cross-prompt injection 같은 공격 시나리오를 재현 가능하게 만들고, 확률적 LLM 동작을 반영하기 위해 다회 실행과 통계 임계치를 지원한다. Clarity는 desktop app, web UI, coding agent 내장 방식으로 동작하며, 문제 정의, 대안 탐색, 실패 분석, 의사결정을 .clarity-protocol/ 디렉터리의 Markdown 파일로 저장해 PR 리뷰와 diff 대상으로 삼는다.


경쟁 구도 / 비교

기존 AI safety 툴이 보통 모델 평가나 사후 red teaming에 집중했다면, Microsoft는 이번에 설계 검토와 CI 회귀 테스트라는 두 지점에 안전을 심으려 한다. 이는 보안팀 중심 접근보다 개발팀이 직접 운영하는 engineering-native safety 전략에 가깝다. 특히 테스트 결과를 pass/fail 신호로 CI에 넣는 방식은 일반 소프트웨어 품질 관리와의 접점을 넓혀 도입 장벽을 낮춘다.


의미

산업적으로는 agent 안전이 별도 compliance 문서가 아니라 repo 안의 living artifact가 되는 방향을 보여준다. 실무적으로는 조직이 safety review를 중앙팀에만 의존하면 scale이 나오기 어렵고, threat model, 실패 분석, 회귀 테스트를 코드와 함께 버전 관리하는 체계가 있어야 agent를 빠르게 반복 배포할 수 있다.

이어 읽기

관련 읽을거리

전체 보기
2026년 5월 30일Introducing Search Toolkit — agent retrieval 경쟁이 RAG 데모에서 검색 파이프라인 운영력으로 이동Mistral은 2026년 5월 28일 Search Toolkit을 public preview로 공개했다. 이 오픈소스 프레임워크는 ingestion, retrieval, evaluation을 하나의 공통 인터페이스로 묶고, BM25·dense retrieval·hybrid search와 recall, precision, MRR, NDCG 평가를 함께 제공한다.2026년 5월 24일Red Hat Launches New Developer Tools for Agentic AI — 로컬 샌드박스와 공급망 검증이 agent 개발 기본 스택으로 들어온다Red Hat은 2026년 5월 12일 Red Hat Desktop GA, isolated AI agent sandboxing, 그리고 Red Hat Advanced Developer Suite 확장을 발표했다. 핵심은 로컬 Podman 기반 개발 환경, OpenShift Dev Spaces, trusted software factory, SLSA Level 3 기반 Trusted…2026년 5월 14일Conductor — multi-agent orchestration이 LLM 라우팅에서 deterministic YAML workflow로 이동Microsoft는 2026년 5월 14일 오픈소스 CLI Conductor를 공개했다. MIT 라이선스 기반으로 multi-agent workflow를 YAML로 선언하고, 에이전트 간 라우팅을 LLM이 아니라 deterministic graph로 실행하며, 조건 분기는 Jinja2 템플릿과 expression evaluation으로 처리해 orchestration layer 자체의 토큰…2026년 5월 7일Browser Harness - LLM 기반 자가치유 브라우저 자동화 프레임워크Browser Harness는 LLM이 Chrome DevTools Protocol(CDP)을 통해 브라우저 작업을 직접 수행하되, 필요한 헬퍼 코드를 실행 중 스스로 생성하는 자가치유(self-healing) 자동화 프레임워크다. 핵심 코드가 ~1,000줄에 불과한 초경량 구조.