배경 및 맥락
생성형 AI의 초반 경쟁은 답변 한 번의 품질에 집중돼 있었다. 하지만 실제 사용이 길어질수록 병목은 모델 자체보다 문맥 유지에 생긴다. 사용자가 같은 선호, 프로젝트, 제약을 매번 다시 설명해야 하면 도구는 똑똑해 보여도 관계는 누적되지 않는다.
OpenAI의 이번 업데이트는 memory를 부가 기능이 아니라 ChatGPT 제품 경험의 기반 계층으로 재정의한다. 특히 수억 명 규모와 다년 사용 시나리오에서 stale memory, 잘못된 사실, 확장 비용이 문제였다고 직접 밝힌 점은, personalization이 이제 단순 UX 옵션이 아니라 대규모 시스템 문제라는 뜻이다.
핵심 내용
공식 발표에 따르면 기존 saved memories는 대화 중 명시적 신호에 크게 의존했고 시간이 지나면 정보가 낡거나 부정확해지기 쉬웠다. OpenAI는 2025년에 chat history를 참고해 memory를 background에서 curate하는 첫 dreaming 버전을 도입했고, 이번에는 그 위에 더 compute-efficient한 새 memory architecture를 올렸다.
새 구조에서는 여러 대화에서 추출한 기억을 synthesis해 더 최신이고 관련성 높은 문맥을 유지한다. 또 memory summary 페이지에서 ChatGPT가 사용자를 어떻게 이해하고 있는지 검토하고, 수정하거나 삭제할 수 있게 했다. 제품적으로는 memory를 숨겨진 내부 상태가 아니라 reviewable state로 노출하는 방향이다.
경쟁 구도 / 비교
지금까지 많은 AI 제품의 personalization은 custom instruction, pinned note, retrieval cache 같은 정적인 방식에 머물렀다. 이런 접근은 구현은 쉽지만 시간이 흐를수록 stale context와 과잉 기억, 잘못된 추론 문제가 누적된다. OpenAI가 memory architecture 자체를 다시 설계한 것은 장기 사용자 관계를 가진 AI product가 결국 별도의 memory operating layer를 필요로 한다는 신호다.
경쟁사 입장에서도 이는 중요한 압박이다. 앞으로는 모델 벤치마크만으로 차별화하기 어렵고, 장기 문맥 유지와 수정 가능성, privacy transparency를 함께 제공해야 사용자를 붙잡을 수 있다.
의미
산업적으로는 assistant가 search box에서 relationship product로 이동하는 분기점에 가깝다. 사용자를 더 오래 이해하는 AI가 더 높은 전환율과 체류 시간을 만들 수 있기 때문에, memory는 곧 retention과 monetization의 핵심 기능이 된다.
실무적으로는 AI 서비스 설계 시 memory quality를 별도 KPI로 다뤄야 한다. freshness, correction latency, user-visible summary, opt-out flow, sensitive data boundary를 정의하지 않으면 personalization이 경쟁력이 아니라 신뢰 리스크가 될 수 있다.