PickleeAI와 개발, 오늘 볼 변화만
홈읽을거리아카이브
검색

Picklee

AI와 개발 현장에서 오늘 확인할 변화만 선별합니다.

© 2026 Picklee. All rights reserved.

RSSSitemap

읽을거리

2026년 6월 4일

Redis Iris — agent stack이 prompt tuning에서 context engine 아키텍처로 이동

Redis는 2026년 5월 18일 Redis Iris를 발표하며 agent failure의 핵심 원인을 모델 성능이 아니라 context layer의 분산·지연·낙후 문제로 규정했다. Iris는 Context Retriever, Agent Memory, Data Integration, LangCache, Redis Search 다섯 요소를 묶어…

본문 읽기원문 보기

발행일

2026년 6월 4일

업데이트

2026년 6월 4일

주제

AI
에이전트
오픈소스
원문 보기

배경 및 맥락

초기 생성형 AI 애플리케이션은 좋은 모델과 그럴듯한 프롬프트만 있으면 어느 정도 데모가 가능했다. 하지만 production 단계에 들어오면 문제는 곧바로 retrieval latency, stale state, fragmented memory, disconnected tools, exploding token cost로 옮겨간다. 즉 agent가 실패하는 이유는 모델이 멍청해서가 아니라, 필요한 맥락이 제때 올바른 형태로 공급되지 않아서인 경우가 많다.

Redis는 이 현실을 'context problem'으로 정의하고, agent stack의 별도 부품들을 하나의 runtime layer로 묶으려 한다. 이는 AI 인프라가 prompt engineering 중심에서 context engineering과 operational state management 중심으로 이동하고 있음을 보여준다.


핵심 내용

Redis Iris는 Context Retriever, Agent Memory, Redis Data Integration, LangCache, Redis Search 다섯 요소를 하나의 context engine으로 묶는다. 공식 글에 따르면 Context Retriever는 business entity, field, relationship, access rule을 정의하면 agent가 사용할 MCP tools를 자동 생성해 structured business data 위에 controlled retrieval layer를 제공한다. Agent Memory는 최근 상호작용, 사용자 선호, 장기 상태를 저장해 session과 task를 넘어서는 durable memory를 관리한다.

Redis는 이 구조가 navigable context, fast retrieval, always up-to-date context, compounding memory라는 네 가지 요구를 충족한다고 설명한다. 또한 Redis가 이미 43% of enterprise AI agent stacks에 들어가 있다는 점을 내세우며, sub-millisecond latency와 multi-cloud deployment를 결합한 범용 runtime layer로 포지셔닝한다.


경쟁 구도 / 비교

기존 agent stack은 vector DB, semantic cache, memory service, CDC pipeline, search system을 따로 붙이는 경우가 많았다. 이 방식은 유연하지만 운영 복잡도와 consistency 문제를 키운다. Redis Iris의 차별점은 이 여러 레이어를 하나의 low-latency operational data plane으로 통합해 agent runtime 관점에서 단순화하려는 데 있다.

이는 단순 RAG 툴킷과도 다르다. 목적이 문서 검색 향상이 아니라, agent가 business entity를 따라가며 구조화된 상태와 실시간 변화를 함께 이해하도록 만드는 것이기 때문이다. 결국 경쟁도 '누가 더 잘 검색하나'에서 '누가 더 잘 동작하는 context runtime을 주나'로 이동한다.


의미

산업적으로는 AI 스택의 새 승부처가 foundation model 위가 아니라 그 아래 runtime data plane에서 열리고 있다는 신호다. context engine은 앞으로 vector database, cache, memory, integration 카테고리를 다시 묶는 통합 계층이 될 가능성이 있다.

실무적으로는 agent 프로젝트의 병목을 프롬프트나 모델 교체로만 해결하려 하면 한계가 빨리 드러난다. session memory, fresh operational data, governed structured access, token optimization을 어떻게 설계할지 먼저 정하지 않으면, agent 수가 늘수록 비용과 장애 면적만 커질 가능성이 높다.

이어 읽기

관련 읽을거리

전체 보기
2026년 6월 12일OpenEnv committee launch — open agent training이 harness별 튜닝에서 공유 environment protocol로 이동Hugging Face는 2026년 6월 8일 OpenEnv가 Meta-PyTorch, Nvidia, Modal, Prime Intellect, Unsloth 등과 함께 위원회 기반 프로젝트로 전환됐다고 발표했다. OpenEnv는 터미널, 브라우저 등 agent execution environment를 표준 인터페이스로 노출하는 레이어로 정의되며,…2026년 5월 31일Introducing Trusted Remote Execution: Policy-Enforced Scripts for AI Agents and HumansAWS는 2026년 5월 4일 Trusted Remote Execution(Rex)을 오픈소스로 공개했다. Rex는 Rhai 스크립트가 host에 직접 접근하지 못하게 하고, 모든 시스템 작업을 Cedar policy로 승인한 뒤에만 실행하는 runtime으로, AI agent가 만든 스크립트도 동일한 정책 경계 안에서 동작한다.2026년 5월 30일Introducing Search Toolkit — agent retrieval 경쟁이 RAG 데모에서 검색 파이프라인 운영력으로 이동Mistral은 2026년 5월 28일 Search Toolkit을 public preview로 공개했다. 이 오픈소스 프레임워크는 ingestion, retrieval, evaluation을 하나의 공통 인터페이스로 묶고, BM25·dense retrieval·hybrid search와 recall, precision, MRR, NDCG 평가를 함께 제공한다.2026년 5월 29일Linux Foundation launches DNS-AID — agent discovery 경쟁이 중앙 레지스트리에서 DNS 기반 개방 표준으로 이동Linux Foundation은 2026년 5월 27일 DNS-AID 프로젝트를 공개했다. 이 프로젝트는 DNS 인프라를 활용해 AI agents와 MCP servers를 publish, discover, verify할 수 있게 하는 오픈소스 reference implementation으로, Python SDK·CLI·MCP server를 함께 제공한다.