Agent Memory 论文演进与综述精读 学习路线
面向研究生 / 准备读 Memory 方向 PhD / 工业界要快速吸收文献的读者:从 4 篇 survey 入门到 40+ 篇系统逐篇深读,覆盖 G1 奠基(MemGPT/Generative Agents/HippoRAG/MemoryBank/ReadAgent)、G2/G3 SOTA(Mem0/A-Mem/MemoryOS/LightMem/EMem/Memori 等 11 系统)、4 个 benchmark、5 个 diagnosis 论文、3 个交叉方向,给 3 周 / 8 周 / 12 周三档阅读路线
Agent Memory 这条赛道在 2023-2026 三年里冒出 100+ 篇相关论文,新人很容易陷入”每天读两篇还是赶不上”的焦虑。本路线不教你”造一套新的 Memory”——那是模块五;也不教你”审计别人的 Memory 论文”——那是模块十九。本路线专门解决”怎么以最快速度吸收这条赛道的文献”:从 4 篇 survey 切入(拿到地图),用阅读方法论压缩单篇阅读时间(30 分钟读完一篇),按代次和方向逐篇精读 40+ 篇代表性论文,给 3 周 / 8 周 / 12 周三档学习节奏。读完路线,你能在 Memory reading group 里”听别人讲一篇你没读的论文 5 分钟就能跟上”,能在自己写论文时”30 秒决定一篇新出论文是否值得读”。
作者基于 11 系统代码级 atlas + 40+ 篇精读笔记的实战经验编写本系列。
📑 目录
🌟 全景概览:为什么 Memory 论文需要”演进式精读”
Memory 论文有 3 个特点让”挨个读”低效
- 演进信号强:MemGPT (2023) 的 OS 隐喻 → 几乎所有 G3 系统都默认”Long/Short 双层”;不知道这条线,读 LightMem (2026) 会觉得”为什么默认要分层”
- 代码隐含信息多:80% 关键 design choice 不在论文里写,在 GitHub repo 的
query()函数签名里——本路线提供代码级精读卡 - 方法论变化快:2023 论文还在比绝对 leaderboard;2025-2026 paired McNemar / preregistration 成为 reviewer 默认期望——读法要随时代变
🍎 直觉:如果你按 arXiv 时间倒序挨个读,会反复”读完一篇不知道它在地图上哪个位置”。先看 survey 拿地图,再按代次纵深,效率提升 5-10 倍。
🧠 本路线的 4 个核心洞察
| 洞察 | 一句话 | 哪一章讲透 |
|---|---|---|
| 洞察 1 | Survey 不是”懒人版论文”,是必须先读的”领域地图” | 第 2 章 |
| 洞察 2 | 单篇 Memory 论文 30 分钟读完——靠 7 段切片法 | 第 3 章 |
| 洞察 3 | G1 → G2 → G3 三代演进比”按 venue 读”更有信息量 | 第 4-5 章 |
| 洞察 4 | Benchmark 论文 + Diagnosis 论文 = 50% 的”水分识别”能力 | 第 6-7 章 |
📖 章节导览
整个模块 9 章,按”地图 → 工具 → 代次精读 → 横切方向 → 实战路线”组织:
| 章 | 主题 | 覆盖论文数 | 核心问题 |
|---|---|---|---|
| 1 | 入门概览:Agent Memory 论文地图 | (元信息) | 这条赛道有哪些 sub-area?哪些先读哪些后读? |
| 2 ⭐ | Survey 级精读(4 篇 meta-work) | 4 | 如何用 1 周拿到整条赛道的”地图”? |
| 3 | 阅读方法论 | (元方法) | 怎么 30 分钟读完一篇 Memory 论文 + 记 notes |
| 4 | G1 奠基期精读(2023-2024 上) | 5 | MemGPT / Generative Agents / HippoRAG / MemoryBank / ReadAgent |
| 5 | G2/G3 SOTA 精读(2024 下-2026) | 11 | Mem0 / A-Mem / MemoryOS / LightMem / EMem / Memori / LiCoMemory / Nemori / SimpleMem / D-MEM / Selective Memory |
| 6 | Benchmark 论文精读 | 4 | LongMemEval / LoCoMo / MemBench / MEMTRACK 各自的角色和数据 |
| 7 | Diagnosis / 实证类精读 | 5 | ”retrieval 解释 20pp”、“cache 没用”等揭真相工作 |
| 8 | 交叉方向:Memory × RL / Multi-Agent / Multi-Modal | 6+ | 这些方向的代表论文与 mainstream 的差异 |
| 9 | 阅读路线 + 端到端:从读到复现到写 | (整合) | 3/8/12 周路线、reading group SOP、自己写论文 |
总覆盖:~40 篇论文逐篇精读卡,每篇含动机 / 机制 / 数据 / 批评 / 对后续工作的影响。
📅 必读 40 篇论文清单(按 type 分组)
Survey / Meta-work(4 篇)
- CoALA(Sumers et al., 2023) — Cognitive Architectures for Language Agents
- Memory Survey 2025(Zhang et al.) — 把 G1-G3 系统性梳理
- MemOS(Li et al., 2025) — Memory OS for AI System
- Anatomy of Agentic Memory(Anonymous, 2026) — 评测局限的 empirical analysis
G1 奠基(5 篇)
- MemGPT(Packer et al., 2023)
- Generative Agents(Park et al., 2023)
- HippoRAG(Gutiérrez et al., 2024)
- MemoryBank(Zhong et al., 2024)
- ReadAgent(Lee et al., 2024)
G2/G3 SOTA(11 篇)
- Mem0(Chhikara et al., 2025)
- A-Mem(Xu et al., NeurIPS 2025)
- MemoryOS(Kang et al., EMNLP 2025)
- LightMem(Fang et al., ICLR 2026)
- EMem(Zhou, 2025)
- Memori(Anonymous, 2026)
- LiCoMemory(Huang et al., 2025)
- Nemori(Nan et al., 2025)
- SimpleMem(Anonymous, 2026)
- D-MEM(Song & Xin, 2026)
- Selective Memory(Zahn & Chana, 2026)
Benchmark(4 篇)
- LongMemEval(Wu et al., ICLR 2025)
- LoCoMo(Maharana et al., 2024)
- MemBench(2025)
- MEMTRACK(2025)
Diagnosis / 实证(5 篇)
- Diagnosing Retrieval vs Utilization(Yuan et al., 2026)
- 本模块作者论文(Anonymous, 2026) — Cache Hits Don’t Save Agent Memory 27-29. 其他 diagnosis 工作(待补)
交叉方向(6+ 篇)
30-32. Memory × RL:D-MEM、RMM、其他 33-35. Memory × Multi-Agent:G-Memory、Collaborative Memory、Hindsight 36-40. Memory × Multi-Modal:视觉记忆、空间记忆相关
🗓️ 3 周 / 8 周 / 12 周阅读路线
🚀 3 周快速入门(适合:要快速决定是否进入这个方向)
| 周 | 任务 | 章节 |
|---|---|---|
| 1 | 第 1 章 + 第 2 章 Survey 精读 + 第 3 章读法 | Ch1-3 |
| 2 | G1 5 篇 + G2/G3 选 5 篇代表 | Ch4 + Ch5 部分 |
| 3 | 4 个 benchmark + 2 个 diagnosis | Ch6 + Ch7 部分 |
产出:能在面试 / lab 入组面谈中流畅讨论 Memory 赛道。
📚 8 周扎实路线(适合:研究生入学第一学期)
| 周 | 任务 |
|---|---|
| 1 | Ch1-3 同上 |
| 2-3 | Ch4 G1 5 篇深读 + GitHub repo 浏览 |
| 4-5 | Ch5 G2/G3 11 篇深读 + 代码精读卡 |
| 6 | Ch6 4 个 benchmark 跑通其中 1 个 |
| 7 | Ch7 Diagnosis 5 篇 + 自己跑一次 paired eval |
| 8 | Ch8 交叉方向选 1 个深入 + Ch9 准备 reading group |
产出:能讲完整 Agent Memory 综述 1 小时;能复现 LongMemEval 或 LoCoMo 上的至少 1 个系统。
🎓 12 周深度路线(适合:要发 Memory 方向 PhD 第一篇论文)
| 周 | 任务 |
|---|---|
| 1-3 | 同 8 周路线 1-5 周加速版 |
| 4-6 | 全部 40 篇深读 + 自己写 11 系统 atlas 卡片 |
| 7-8 | 跑 LongMemEval + LoCoMo 双 benchmark(结合模块十九 ch4 统计三件套) |
| 9-10 | 选 1 个开放问题(参考模块十九 ch2 §6 OP1-OP5)做 pilot 实验 |
| 11-12 | 写 paper draft(结合模块十九 ch8 端到端模板) |
产出:一篇可投 ARR / EMNLP / NeurIPS 的初稿。
⚠️ 常见入门误区
| 误区 | 后果 | 怎么避免 |
|---|---|---|
| ”我先把 100 篇都看一遍” | 3 个月不出门,看完发现大多数论文讲同一件事 | 先读 4 篇 survey 拿地图(第 2 章) |
| “只看 abstract” | 错过 80% 的设计选择(在 method / code) | 用第 3 章的 7 段切片法(含 code-walk) |
| “按 venue 读”(只读顶会) | 错过 arXiv 上的关键 diagnosis 论文 | 按代次和 type 读(本路线组织方式) |
| “不读 benchmark 论文,直接看用 benchmark 的论文” | 不知道 oracle / judge / 不可比性的来源 | 第 6 章把 4 个 benchmark 论文当一等公民 |
| ”只读正结果论文” | 看不到方法论演进 | 第 7 章 diagnosis 类必读 |
📚 参考资料
概念入门
- 本模块第 1 章 —— Agent Memory 论文地图(演进 + 5 问题域)
- 模块五 Agent Memory 学习路线 —— Agent Memory学习路线.md:先把”Memory 是什么”搞清楚再来精读
- 模块十九 实证审计学习路线 —— 读完论文要审 / 自己写论文时的工具
关键论文(4 篇 survey 入口)
- CoALA(Sumers et al., 2023) —— Cognitive Architectures for Language Agents
- MemOS(Li et al., 2025):arXiv 2507.03724
- Anatomy of Agentic Memory(Anonymous, 2026):arXiv 2602.19320
- Memory Survey 2025(最新 systematic review,部分仍是 arXiv preprint)
行业讨论
- OpenReview ARR / NeurIPS / ICLR 的 Memory 类论文公开评审 —— 看真实 reviewer 关切
- arXiv “agent memory” / “long-term memory LLM” 关键词周更 —— 每月扫一次保持最新
框架文档(如适用)
- Letta / MemGPT GitHub —— G2 → G3 过渡的工程化样本
- Mem0 / A-Mem / MemoryOS GitHub —— G3 三大代表的实际代码
这条路线服务于**“快速吸收文献”** 这一具体目标。如果你已经熟读完,想动手造系统去模块五;想审论文去模块十九;想 PhD 选题,回到本路线第 8-9 章。