前言
早期的 RAG 系统有一个致命缺陷: 每次对话都是独立的,无法记住之前的上下文。本文将探讨 RAG 如何从无状态走向有状态,以及记忆系统如何成为 Agent 的基础能力。
早期 RAG 的问题: 健忘症
每次对话都是新的
TODO: 展示无状态 RAG 的局限性
上下文丢失的后果
TODO: 用户体验的断裂
Short-term Memory: 对话历史管理
滑动窗口策略
TODO: 如何管理有限的上下文窗口
Token 预算分配
TODO: System Prompt + History + Retrieved Docs 的权衡
Long-term Memory: 经验积累
对话摘要存入向量库
TODO: 如何将历史对话转化为长期记忆
记忆的检索和召回
TODO: 何时需要召回历史经验?
记忆的分层设计
Working Memory
TODO: 当前对话的短期缓存
Episodic Memory
TODO: 事件性记忆,具体对话的完整记录
Semantic Memory
TODO: 语义记忆,提取的知识和规律
记忆系统的架构设计
TODO: 架构图和伪代码
记忆系统是 Agent 的基础
为什么 Agent 需要记忆?
TODO: 引出下一个系列 Agent 的核心能力
从 RAG 到 Agent 的演进
TODO: 记忆是自主性的前提
小结
TODO: 总结 RAG 系列,预告 Agent 系列
系列文章:
- 上一篇: 从文本切块到语义检索: RAG 的工程化实践
- 下一篇: 从 AutoGPT 到 Agent 范式: AI 为什么需要"自主性"?
- 原文作者: cathay
- 原文链接: https://blog.chenguotai.com/rag-memory-system.html
- 版权声明:本作品采用 署名-非商业性使用 4.0 国际 (CC BY-NC 4.0)进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
