跳到主要内容
Agent Memory 论文演进与综述精读

第9章:阅读路线与端到端——从读到复现到写自己的

3 周 / 8 周 / 12 周三档阅读路线 detailed 周计划;reading group 12 人 lab 实操;从 reading 到 reproducing 到 writing 三阶段过渡;如何用本路线 + 模块五 + 模块十九 拼出一篇 ARR / EMNLP 投稿

阅读路线 reading group 复现 writing PhD 选题 ARR

前 8 章给了你”地图、工具、40+ 篇精读卡”。本章把这些资源拼成可执行的周计划:3 周快速入门、8 周扎实路线、12 周深度路线各自的 detailed 任务清单;reading group 的 SOP;从”读论文”到”复现 benchmark”到”写自己的论文”三阶段过渡指南;以及如何用本路线 + 模块五(工程构建)+ 模块十九(实证审计)三个模块协同拼出一篇 ARR / EMNLP 投稿。

📑 目录


1. 3 周快速入门 detailed 周计划

目标:能在面试 / lab 入组面谈中流畅讨论 Memory 赛道

Week 1:地图 + 工具

Day任务时长
1本路线第 1 章(论文地图)+ 第 3 章(30 分钟切片法)2 h
2本路线第 2 章 CoALA 精读1.5 h
3本路线第 2 章 MemOS 精读1.5 h
4本路线第 2 章 Memory Survey 2025 浏览1 h
5本路线第 2 章 Anatomy of Agentic Memory 精读1.5 h
6-7建立个人 Notion / Obsidian 笔记模板 + 整理 4 篇 survey 术语词典2 h

Week 1 产出:完整的 20 术语词典 + 4 篇 survey 笔记。

Week 2:G1 + 部分 G3

Day任务时长
1-2G1 5 篇精读(MemGPT / Generative Agents / HippoRAG / MemoryBank / ReadAgent)4 h
3Mem0 精读 + 浏览 GitHub1.5 h
4A-Mem 精读 + 浏览 GitHub1.5 h
5MemoryOS 精读1.5 h
6SimpleMem + LightMem 精读2 h
7整理 G1-G3 传承图(手画或 ASCII)1 h

Week 2 产出:能讲清”G3 的每个设计选择都来自 G1 哪一篇”。

Week 3:Benchmark + Diagnosis

Day任务时长
1LongMemEval 精读 + 下载数据 + 跑 1 个 sanity query2 h
2LoCoMo 精读 + 下载数据1.5 h
3MemBench + MEMTRACK 浏览1 h
4Yuan’26 Diagnosing Retrieval vs Utilization 精读1.5 h
5本模块作者论文(Cache Hits Don’t Save)精读2 h
6整理”我感兴趣的 5 个论文”列表1 h
7准备 5 分钟 talk:“我对 Agent Memory 赛道的理解”1 h

Week 3 产出:能在 lab 面谈中讲 5 分钟 + 给面试官提 3 个有深度的问题。


2. 8 周扎实路线 detailed 周计划

目标:能讲完整 Agent Memory 综述 1 小时 + 能复现 1 个系统

主任务子任务
13 周路线 Week 1 加速版同上
2G1 5 篇 deep-read全部 30 分钟切片 + code-walk
3G3 前 6 篇(Mem0 / A-Mem / MemoryOS / LightMem / EMem / SimpleMem)同上 + atlas 卡片
4G3 后 5 篇(Memori / LiCoMemory / Nemori / D-MEM / Selective Memory)同上
54 个 benchmark 全部精读 + 跑通 LongMemEval-S 1 个 baseline模块十九 Ch8 §3-4
65 篇 Diagnosis 类全部精读重点:本模块作者论文 + Anatomy
7选 1 个 G3 系统,clone repo + 在 LongMemEval 上跑 paired vs C1模块十九 Ch4 工具
8准备 1 小时 Agent Memory survey talk + 建立 lab reading group SOP本章 §6

8 周产出

  • 完整 40 篇精读笔记
  • 能在 LongMemEval 上复现 1 个 G3 系统并跑 paired 配对
  • lab 内 reading group 启动

3. 12 周深度路线 detailed 周计划

目标:一篇可投 ARR / EMNLP / NeurIPS 的初稿

任务
1-4同 8 周路线 1-5 周加速版(4 周吃完 40 篇)
5选 1 个开放问题(参考模块十九 Ch2 §6 OP1-OP5 或本路线 Ch8 §6 OP-RL/MA/MM)
6写 EXPERIMENTS_PREREG.md + DEVIATIONS.md(模块十九 Ch4)
7-8跑 LongMemEval-S H1a × 4 backbone(模块十九 Ch6 + Ch8)
9跑 LoCoMo H1b primary + sanity(模块十九 Ch8 §6)
10跑 C+oracle positive control(模块十九 Ch5)
11论文骨架(ACL template)+ abstract + intro + experiments
12discussion + limitations + 第一轮 GPT-5.4 review + 修订

12 周产出

  • ARR 可投初稿(含 6.5/10+ 评分目标)
  • 完整开源代码 + EXPERIMENTS_PREREG + DEVIATIONS
  • 11 系统 atlas 卡片

4. 三阶段过渡:从读到复现到写

        Stage 1: Reading       Stage 2: Reproducing      Stage 3: Writing
        ─────────────────      ─────────────────────     ──────────────────
         40+ 篇 atlas 笔记 →    跑通 1-2 个 G3 系统 →    写自己的 paper

Skills:   30 分钟切片法            paired McNemar              EXPERIMENTS_PREREG
         code-walk             cluster bootstrap         positive control
         atlas 化              cumulative-effect plot    DEVIATIONS 诚实披露

4.1 Stage 1 → Stage 2 过渡

触发条件:你已经能为 11 个 G3 系统每个写出 200 字 atlas 卡片。

第一个复现项目建议

  • 用 SimpleMem(最简单)或 Mem0(最完整)
  • 在 LongMemEval-S 跑 100 题 sanity
  • 输出:与 C1 zero-build retrieval 的 paired Δ

4.2 Stage 2 → Stage 3 过渡

触发条件:你已经跑通 1 个 paired benchmark 评测 + 能写出 EXPERIMENTS_PREREG.md。

第一篇论文建议

  • 不要做”我提出新方法”——做 Diagnosis(参考模块十九 Ch7)
  • 选一个 G3 系统 + 一个 critique 视角(如”它的 reflection trigger 是否真有用”)
  • 把模块十九的 6 步范式做齐

🌟 核心Reading → Reproducing → Writing 三阶段,预计 PhD 第一年走完。本路线 + 模块五 + 模块十九 给你完整工具链。


5. 三模块协同:本路线 + 模块五 + 模块十九

三个模块解决不同子任务,协同使用效率最高

┌─────────────────────────────────────────────────────────────┐
│  模块五 Agent Memory                                         │
│  ↓ 教你 "Memory 是什么 / 怎么造"                             │
│  适用于:第一次接触 Memory 的工程实现                        │
└─────────────────────────────────────────────────────────────┘

              ▼ 入门后
┌─────────────────────────────────────────────────────────────┐
│  模块二十(本路线) 论文演进与综述精读                       │
│  ↓ 教你 "Memory 论文怎么读 / 怎么吸收文献"                  │
│  适用于:研究入门、PhD 准备选题、reading group 启动          │
└─────────────────────────────────────────────────────────────┘

              ▼ 选定方向后
┌─────────────────────────────────────────────────────────────┐
│  模块十九 实证审计与负结果方法论                              │
│  ↓ 教你 "Memory 论文怎么审 / 自己怎么写实证论文"            │
│  适用于:审稿、reproducibility 评估、写自己的 paper         │
└─────────────────────────────────────────────────────────────┘

5.1 12 周 ARR 投稿的三模块协同

主任务主用模块
1-4吃透文献 + 选方向模块二十
5写 PREREG模块十九 Ch4
6-7跑 H1a × 4 backbone模块十九 Ch6
8跑 H1b模块十九 Ch8
9跑 positive control模块十九 Ch5
10论文骨架模块十九 Ch8 §9
11-12写 + review + 修订模块十九 + 模块二十 Ch5(看自己怎么被审)

🌟 核心不要只用一个模块。模块五给基础概念,模块二十给文献和方向,模块十九给方法论严谨。三个加起来才是完整的”PhD 第一年”。


6. PhD 选题决策树

你想做 Agent Memory 方向 PhD?


你倾向 SOTA(提出新方法)还是 Diagnosis(揭真相)?

   ├─ SOTA 路径("我做了个更聪明的 trigger")
   │     ├─ 难度:高(要打过所有同期 G3 系统)
   │     ├─ 时间:18-24 个月一篇 paper
   │     ├─ 失败风险:高(被同期工作 frontrun)
   │     └─ 建议方向:Memory × RL 或 Memory × Multi-Agent(mainstream 空间小)

   └─ Diagnosis 路径("我证明大家信错了")
         ├─ 难度:中(严格方法论即可,不需打过 SOTA)
         ├─ 时间:6-12 个月一篇 paper
         ├─ 失败风险:低(揭真相本身就是贡献)
         └─ 建议方向:本路线 Ch7 的 5 篇 Diagnosis 风格 +
                      自己选一个未被审计的 G3 子方向

🌟 本模块作者建议PhD 第一篇 paper 走 Diagnosis 路径,第二篇可以选 SOTA。理由:

  • Diagnosis 教你方法论(一生受用)
  • SOTA 教你工程(也有用,但短期)
  • 先方法论后工程 = 更稳的学术轨迹

✅ 自我检验清单

  • 能为自己的当下目标(快速入门 / PhD 选题 / ARR 投稿)选合适的周计划
  • 能在 lab 里组织 12 人 reading group 并写 SOP(参考第 3 章 §5)
  • 能从 P0 10 篇中选 1 篇跑通它的 GitHub repo(Reproducing 起步)
  • 能用本模块 + 模块五 + 模块十九 三个模块的工具凑出 ARR 投稿 12 周流程
  • 能为下一年读到的 30+ 篇新论文给出 P0/P1/P2/P3 评级
  • 能为自己写出 EXPERIMENTS_PREREG.md 启动 pilot 实验
  • 能在 SOTA vs Diagnosis 路径决策上做出有自己理由的选择

📚 参考资料

概念入门

  • 本路线第 1-8 章 —— 本章是综合 + 实操
  • 模块五 Agent Memory 学习路线 —— 工程基础
  • 模块十九 实证审计学习路线 —— 方法论工具

关键论文

  • 本模块作者论文 —— 12 周 PhD 第一篇 paper 的真实样本
  • 模块二十 Ch7 5 篇 Diagnosis —— Diagnosis 路径的方法论参考

行业讨论

  • ARR / EMNLP / NeurIPS 投稿流程 —— Memory 类论文最适合的 venue
  • OpenReview 公开评审记录 —— 看类似主题论文如何被 review

框架文档(如适用)

  • ACL Style Filesacl-org/acl-style-files
  • OSF(Open Science Framework) —— 预注册托管
  • HuggingFace LongMemEval / LoCoMo 数据 —— 跑 benchmark 的起点

走完 12 周路线,你会发现自己已经从”读论文焦虑”变成”评论论文 + 自己写论文”——这是本模块的最终目标。