Agent Memory 论文演进与综述精读 2026年5月11日

Agent Memory 论文演进与综述精读学习路线

面向研究生 / 准备读 Memory 方向 PhD / 工业界要快速吸收文献的读者：从 4 篇 survey 入门到 40+ 篇系统逐篇深读，覆盖 G1 奠基（MemGPT/Generative Agents/HippoRAG/MemoryBank/ReadAgent）、G2/G3 SOTA（Mem0/A-Mem/MemoryOS/LightMem/EMem/Memori 等 11 系统）、4 个 benchmark、5 个 diagnosis 论文、3 个交叉方向，给 3 周 / 8 周 / 12 周三档阅读路线

Agent Memory 论文综述快速入门 survey MemGPT Mem0 A-Mem LongMemEval

Agent Memory 这条赛道在 2023-2026 三年里冒出 100+ 篇相关论文，新人很容易陷入”每天读两篇还是赶不上”的焦虑。本路线不教你”造一套新的 Memory”——那是模块五；也不教你”审计别人的 Memory 论文”——那是模块十九。本路线专门解决”怎么以最快速度吸收这条赛道的文献”：从 4 篇 survey 切入（拿到地图），用阅读方法论压缩单篇阅读时间（30 分钟读完一篇），按代次和方向逐篇精读 40+ 篇代表性论文，给 3 周 / 8 周 / 12 周三档学习节奏。读完路线，你能在 Memory reading group 里”听别人讲一篇你没读的论文 5 分钟就能跟上”，能在自己写论文时”30 秒决定一篇新出论文是否值得读”。

作者基于 11 系统代码级 atlas + 40+ 篇精读笔记的实战经验编写本系列。

🌟 全景概览：为什么 Memory 论文需要”演进式精读”

Memory 论文有 3 个特点让”挨个读”低效

演进信号强：MemGPT (2023) 的 OS 隐喻 → 几乎所有 G3 系统都默认”Long/Short 双层”；不知道这条线，读 LightMem (2026) 会觉得”为什么默认要分层”
代码隐含信息多：80% 关键 design choice 不在论文里写，在 GitHub repo 的 query() 函数签名里——本路线提供代码级精读卡
方法论变化快：2023 论文还在比绝对 leaderboard；2025-2026 paired McNemar / preregistration 成为 reviewer 默认期望——读法要随时代变

🍎 直觉：如果你按 arXiv 时间倒序挨个读，会反复”读完一篇不知道它在地图上哪个位置”。先看 survey 拿地图，再按代次纵深，效率提升 5-10 倍。

🧠 本路线的 4 个核心洞察

洞察	一句话	哪一章讲透
洞察 1	Survey 不是”懒人版论文”，是必须先读的”领域地图”	第 2 章
洞察 2	单篇 Memory 论文 30 分钟读完——靠 7 段切片法	第 3 章
洞察 3	G1 → G2 → G3 三代演进比”按 venue 读”更有信息量	第 4-5 章
洞察 4	Benchmark 论文 + Diagnosis 论文 = 50% 的”水分识别”能力	第 6-7 章

📖 章节导览

整个模块 9 章，按”地图 → 工具 → 代次精读 → 横切方向 → 实战路线”组织：

章	主题	覆盖论文数	核心问题
1	入门概览：Agent Memory 论文地图	(元信息)	这条赛道有哪些 sub-area？哪些先读哪些后读？
2 ⭐	Survey 级精读（4 篇 meta-work）	4	如何用 1 周拿到整条赛道的”地图”？
3	阅读方法论	(元方法)	怎么 30 分钟读完一篇 Memory 论文 + 记 notes
4	G1 奠基期精读（2023-2024 上）	5	MemGPT / Generative Agents / HippoRAG / MemoryBank / ReadAgent
5	G2/G3 SOTA 精读（2024 下-2026）	11	Mem0 / A-Mem / MemoryOS / LightMem / EMem / Memori / LiCoMemory / Nemori / SimpleMem / D-MEM / Selective Memory
6	Benchmark 论文精读	4	LongMemEval / LoCoMo / MemBench / MEMTRACK 各自的角色和数据
7	Diagnosis / 实证类精读	5	”retrieval 解释 20pp”、“cache 没用”等揭真相工作
8	交叉方向：Memory × RL / Multi-Agent / Multi-Modal	6+	这些方向的代表论文与 mainstream 的差异
9	阅读路线 + 端到端：从读到复现到写	(整合)	3/8/12 周路线、reading group SOP、自己写论文

总覆盖：~40 篇论文逐篇精读卡，每篇含动机 / 机制 / 数据 / 批评 / 对后续工作的影响。

📅 必读 40 篇论文清单（按 type 分组）

Survey / Meta-work（4 篇）

CoALA（Sumers et al., 2023） — Cognitive Architectures for Language Agents
Memory Survey 2025（Zhang et al.） — 把 G1-G3 系统性梳理
MemOS（Li et al., 2025） — Memory OS for AI System
Anatomy of Agentic Memory（Anonymous, 2026） — 评测局限的 empirical analysis

G1 奠基（5 篇）

MemGPT（Packer et al., 2023）
Generative Agents（Park et al., 2023）
HippoRAG（Gutiérrez et al., 2024）
MemoryBank（Zhong et al., 2024）
ReadAgent（Lee et al., 2024）

G2/G3 SOTA（11 篇）

Mem0（Chhikara et al., 2025）
A-Mem（Xu et al., NeurIPS 2025）
MemoryOS（Kang et al., EMNLP 2025）
LightMem（Fang et al., ICLR 2026）
EMem（Zhou, 2025）
Memori（Anonymous, 2026）
LiCoMemory（Huang et al., 2025）
Nemori（Nan et al., 2025）
SimpleMem（Anonymous, 2026）
D-MEM（Song & Xin, 2026）
Selective Memory（Zahn & Chana, 2026）

Benchmark（4 篇）

LongMemEval（Wu et al., ICLR 2025）
LoCoMo（Maharana et al., 2024）
MemBench（2025）
MEMTRACK（2025）

Diagnosis / 实证（5 篇）

Diagnosing Retrieval vs Utilization（Yuan et al., 2026）
本模块作者论文（Anonymous, 2026） — Cache Hits Don’t Save Agent Memory 27-29. 其他 diagnosis 工作（待补）

周	任务	章节
1	第 1 章 + 第 2 章 Survey 精读 + 第 3 章读法	Ch1-3
2	G1 5 篇 + G2/G3 选 5 篇代表	Ch4 + Ch5 部分
3	4 个 benchmark + 2 个 diagnosis	Ch6 + Ch7 部分

产出：能在面试 / lab 入组面谈中流畅讨论 Memory 赛道。

📚 8 周扎实路线（适合：研究生入学第一学期）

周	任务
1	Ch1-3 同上
2-3	Ch4 G1 5 篇深读 + GitHub repo 浏览
4-5	Ch5 G2/G3 11 篇深读 + 代码精读卡
6	Ch6 4 个 benchmark 跑通其中 1 个
7	Ch7 Diagnosis 5 篇 + 自己跑一次 paired eval
8	Ch8 交叉方向选 1 个深入 + Ch9 准备 reading group

产出：能讲完整 Agent Memory 综述 1 小时；能复现 LongMemEval 或 LoCoMo 上的至少 1 个系统。

🎓 12 周深度路线（适合：要发 Memory 方向 PhD 第一篇论文）

周	任务
1-3	同 8 周路线 1-5 周加速版
4-6	全部 40 篇深读 + 自己写 11 系统 atlas 卡片
7-8	跑 LongMemEval + LoCoMo 双 benchmark（结合模块十九 ch4 统计三件套）
9-10	选 1 个开放问题（参考模块十九 ch2 §6 OP1-OP5）做 pilot 实验
11-12	写 paper draft（结合模块十九 ch8 端到端模板）

产出：一篇可投 ARR / EMNLP / NeurIPS 的初稿。

⚠️ 常见入门误区

误区	后果	怎么避免
”我先把 100 篇都看一遍”	3 个月不出门，看完发现大多数论文讲同一件事	先读 4 篇 survey 拿地图（第 2 章）
“只看 abstract”	错过 80% 的设计选择（在 method / code）	用第 3 章的 7 段切片法（含 code-walk）
“按 venue 读”（只读顶会）	错过 arXiv 上的关键 diagnosis 论文	按代次和 type 读（本路线组织方式）
“不读 benchmark 论文，直接看用 benchmark 的论文”	不知道 oracle / judge / 不可比性的来源	第 6 章把 4 个 benchmark 论文当一等公民
”只读正结果论文”	看不到方法论演进	第 7 章 diagnosis 类必读

📚 参考资料

概念入门

本模块第 1 章 —— Agent Memory 论文地图（演进 + 5 问题域）
模块五 Agent Memory 学习路线 —— Agent Memory学习路线.md：先把”Memory 是什么”搞清楚再来精读
模块十九实证审计学习路线 —— 读完论文要审 / 自己写论文时的工具

关键论文（4 篇 survey 入口）

CoALA（Sumers et al., 2023） —— Cognitive Architectures for Language Agents
MemOS（Li et al., 2025）：arXiv 2507.03724
Anatomy of Agentic Memory（Anonymous, 2026）：arXiv 2602.19320
Memory Survey 2025（最新 systematic review，部分仍是 arXiv preprint）

行业讨论

OpenReview ARR / NeurIPS / ICLR 的 Memory 类论文公开评审 —— 看真实 reviewer 关切
arXiv “agent memory” / “long-term memory LLM” 关键词周更 —— 每月扫一次保持最新

框架文档（如适用）

Letta / MemGPT GitHub —— G2 → G3 过渡的工程化样本
Mem0 / A-Mem / MemoryOS GitHub —— G3 三大代表的实际代码

这条路线服务于**“快速吸收文献”** 这一具体目标。如果你已经熟读完，想动手造系统去模块五；想审论文去模块十九；想 PhD 选题，回到本路线第 8-9 章。