第9章:阅读路线与端到端——从读到复现到写自己的
3 周 / 8 周 / 12 周三档阅读路线 detailed 周计划;reading group 12 人 lab 实操;从 reading 到 reproducing 到 writing 三阶段过渡;如何用本路线 + 模块五 + 模块十九 拼出一篇 ARR / EMNLP 投稿
前 8 章给了你”地图、工具、40+ 篇精读卡”。本章把这些资源拼成可执行的周计划:3 周快速入门、8 周扎实路线、12 周深度路线各自的 detailed 任务清单;reading group 的 SOP;从”读论文”到”复现 benchmark”到”写自己的论文”三阶段过渡指南;以及如何用本路线 + 模块五(工程构建)+ 模块十九(实证审计)三个模块协同拼出一篇 ARR / EMNLP 投稿。
📑 目录
- 1. 3 周快速入门 detailed 周计划
- 2. 8 周扎实路线 detailed 周计划
- 3. 12 周深度路线 detailed 周计划
- 4. 三阶段过渡:从读到复现到写
- 5. 三模块协同:本路线 + 模块五 + 模块十九
- 6. PhD 选题决策树
- ✅ 自我检验清单
- 📚 参考资料
1. 3 周快速入门 detailed 周计划
目标:能在面试 / lab 入组面谈中流畅讨论 Memory 赛道。
Week 1:地图 + 工具
| Day | 任务 | 时长 |
|---|---|---|
| 1 | 本路线第 1 章(论文地图)+ 第 3 章(30 分钟切片法) | 2 h |
| 2 | 本路线第 2 章 CoALA 精读 | 1.5 h |
| 3 | 本路线第 2 章 MemOS 精读 | 1.5 h |
| 4 | 本路线第 2 章 Memory Survey 2025 浏览 | 1 h |
| 5 | 本路线第 2 章 Anatomy of Agentic Memory 精读 | 1.5 h |
| 6-7 | 建立个人 Notion / Obsidian 笔记模板 + 整理 4 篇 survey 术语词典 | 2 h |
Week 1 产出:完整的 20 术语词典 + 4 篇 survey 笔记。
Week 2:G1 + 部分 G3
| Day | 任务 | 时长 |
|---|---|---|
| 1-2 | G1 5 篇精读(MemGPT / Generative Agents / HippoRAG / MemoryBank / ReadAgent) | 4 h |
| 3 | Mem0 精读 + 浏览 GitHub | 1.5 h |
| 4 | A-Mem 精读 + 浏览 GitHub | 1.5 h |
| 5 | MemoryOS 精读 | 1.5 h |
| 6 | SimpleMem + LightMem 精读 | 2 h |
| 7 | 整理 G1-G3 传承图(手画或 ASCII) | 1 h |
Week 2 产出:能讲清”G3 的每个设计选择都来自 G1 哪一篇”。
Week 3:Benchmark + Diagnosis
| Day | 任务 | 时长 |
|---|---|---|
| 1 | LongMemEval 精读 + 下载数据 + 跑 1 个 sanity query | 2 h |
| 2 | LoCoMo 精读 + 下载数据 | 1.5 h |
| 3 | MemBench + MEMTRACK 浏览 | 1 h |
| 4 | Yuan’26 Diagnosing Retrieval vs Utilization 精读 | 1.5 h |
| 5 | 本模块作者论文(Cache Hits Don’t Save)精读 | 2 h |
| 6 | 整理”我感兴趣的 5 个论文”列表 | 1 h |
| 7 | 准备 5 分钟 talk:“我对 Agent Memory 赛道的理解” | 1 h |
Week 3 产出:能在 lab 面谈中讲 5 分钟 + 给面试官提 3 个有深度的问题。
2. 8 周扎实路线 detailed 周计划
目标:能讲完整 Agent Memory 综述 1 小时 + 能复现 1 个系统。
| 周 | 主任务 | 子任务 |
|---|---|---|
| 1 | 3 周路线 Week 1 加速版 | 同上 |
| 2 | G1 5 篇 deep-read | 全部 30 分钟切片 + code-walk |
| 3 | G3 前 6 篇(Mem0 / A-Mem / MemoryOS / LightMem / EMem / SimpleMem) | 同上 + atlas 卡片 |
| 4 | G3 后 5 篇(Memori / LiCoMemory / Nemori / D-MEM / Selective Memory) | 同上 |
| 5 | 4 个 benchmark 全部精读 + 跑通 LongMemEval-S 1 个 baseline | 模块十九 Ch8 §3-4 |
| 6 | 5 篇 Diagnosis 类全部精读 | 重点:本模块作者论文 + Anatomy |
| 7 | 选 1 个 G3 系统,clone repo + 在 LongMemEval 上跑 paired vs C1 | 模块十九 Ch4 工具 |
| 8 | 准备 1 小时 Agent Memory survey talk + 建立 lab reading group SOP | 本章 §6 |
8 周产出:
- 完整 40 篇精读笔记
- 能在 LongMemEval 上复现 1 个 G3 系统并跑 paired 配对
- lab 内 reading group 启动
3. 12 周深度路线 detailed 周计划
目标:一篇可投 ARR / EMNLP / NeurIPS 的初稿。
| 周 | 任务 |
|---|---|
| 1-4 | 同 8 周路线 1-5 周加速版(4 周吃完 40 篇) |
| 5 | 选 1 个开放问题(参考模块十九 Ch2 §6 OP1-OP5 或本路线 Ch8 §6 OP-RL/MA/MM) |
| 6 | 写 EXPERIMENTS_PREREG.md + DEVIATIONS.md(模块十九 Ch4) |
| 7-8 | 跑 LongMemEval-S H1a × 4 backbone(模块十九 Ch6 + Ch8) |
| 9 | 跑 LoCoMo H1b primary + sanity(模块十九 Ch8 §6) |
| 10 | 跑 C+oracle positive control(模块十九 Ch5) |
| 11 | 论文骨架(ACL template)+ abstract + intro + experiments |
| 12 | discussion + limitations + 第一轮 GPT-5.4 review + 修订 |
12 周产出:
- ARR 可投初稿(含 6.5/10+ 评分目标)
- 完整开源代码 + EXPERIMENTS_PREREG + DEVIATIONS
- 11 系统 atlas 卡片
4. 三阶段过渡:从读到复现到写
Stage 1: Reading Stage 2: Reproducing Stage 3: Writing
───────────────── ───────────────────── ──────────────────
40+ 篇 atlas 笔记 → 跑通 1-2 个 G3 系统 → 写自己的 paper
Skills: 30 分钟切片法 paired McNemar EXPERIMENTS_PREREG
code-walk cluster bootstrap positive control
atlas 化 cumulative-effect plot DEVIATIONS 诚实披露
4.1 Stage 1 → Stage 2 过渡
触发条件:你已经能为 11 个 G3 系统每个写出 200 字 atlas 卡片。
第一个复现项目建议:
- 用 SimpleMem(最简单)或 Mem0(最完整)
- 在 LongMemEval-S 跑 100 题 sanity
- 输出:与 C1 zero-build retrieval 的 paired Δ
4.2 Stage 2 → Stage 3 过渡
触发条件:你已经跑通 1 个 paired benchmark 评测 + 能写出 EXPERIMENTS_PREREG.md。
第一篇论文建议:
- 不要做”我提出新方法”——做 Diagnosis(参考模块十九 Ch7)
- 选一个 G3 系统 + 一个 critique 视角(如”它的 reflection trigger 是否真有用”)
- 把模块十九的 6 步范式做齐
🌟 核心:Reading → Reproducing → Writing 三阶段,预计 PhD 第一年走完。本路线 + 模块五 + 模块十九 给你完整工具链。
5. 三模块协同:本路线 + 模块五 + 模块十九
三个模块解决不同子任务,协同使用效率最高:
┌─────────────────────────────────────────────────────────────┐
│ 模块五 Agent Memory │
│ ↓ 教你 "Memory 是什么 / 怎么造" │
│ 适用于:第一次接触 Memory 的工程实现 │
└─────────────────────────────────────────────────────────────┘
│
▼ 入门后
┌─────────────────────────────────────────────────────────────┐
│ 模块二十(本路线) 论文演进与综述精读 │
│ ↓ 教你 "Memory 论文怎么读 / 怎么吸收文献" │
│ 适用于:研究入门、PhD 准备选题、reading group 启动 │
└─────────────────────────────────────────────────────────────┘
│
▼ 选定方向后
┌─────────────────────────────────────────────────────────────┐
│ 模块十九 实证审计与负结果方法论 │
│ ↓ 教你 "Memory 论文怎么审 / 自己怎么写实证论文" │
│ 适用于:审稿、reproducibility 评估、写自己的 paper │
└─────────────────────────────────────────────────────────────┘
5.1 12 周 ARR 投稿的三模块协同
| 周 | 主任务 | 主用模块 |
|---|---|---|
| 1-4 | 吃透文献 + 选方向 | 模块二十 |
| 5 | 写 PREREG | 模块十九 Ch4 |
| 6-7 | 跑 H1a × 4 backbone | 模块十九 Ch6 |
| 8 | 跑 H1b | 模块十九 Ch8 |
| 9 | 跑 positive control | 模块十九 Ch5 |
| 10 | 论文骨架 | 模块十九 Ch8 §9 |
| 11-12 | 写 + review + 修订 | 模块十九 + 模块二十 Ch5(看自己怎么被审) |
🌟 核心:不要只用一个模块。模块五给基础概念,模块二十给文献和方向,模块十九给方法论严谨。三个加起来才是完整的”PhD 第一年”。
6. PhD 选题决策树
你想做 Agent Memory 方向 PhD?
│
▼
你倾向 SOTA(提出新方法)还是 Diagnosis(揭真相)?
│
├─ SOTA 路径("我做了个更聪明的 trigger")
│ ├─ 难度:高(要打过所有同期 G3 系统)
│ ├─ 时间:18-24 个月一篇 paper
│ ├─ 失败风险:高(被同期工作 frontrun)
│ └─ 建议方向:Memory × RL 或 Memory × Multi-Agent(mainstream 空间小)
│
└─ Diagnosis 路径("我证明大家信错了")
├─ 难度:中(严格方法论即可,不需打过 SOTA)
├─ 时间:6-12 个月一篇 paper
├─ 失败风险:低(揭真相本身就是贡献)
└─ 建议方向:本路线 Ch7 的 5 篇 Diagnosis 风格 +
自己选一个未被审计的 G3 子方向
🌟 本模块作者建议:PhD 第一篇 paper 走 Diagnosis 路径,第二篇可以选 SOTA。理由:
- Diagnosis 教你方法论(一生受用)
- SOTA 教你工程(也有用,但短期)
- 先方法论后工程 = 更稳的学术轨迹
✅ 自我检验清单
- 能为自己的当下目标(快速入门 / PhD 选题 / ARR 投稿)选合适的周计划
- 能在 lab 里组织 12 人 reading group 并写 SOP(参考第 3 章 §5)
- 能从 P0 10 篇中选 1 篇跑通它的 GitHub repo(Reproducing 起步)
- 能用本模块 + 模块五 + 模块十九 三个模块的工具凑出 ARR 投稿 12 周流程
- 能为下一年读到的 30+ 篇新论文给出 P0/P1/P2/P3 评级
- 能为自己写出 EXPERIMENTS_PREREG.md 启动 pilot 实验
- 能在 SOTA vs Diagnosis 路径决策上做出有自己理由的选择
📚 参考资料
概念入门
- 本路线第 1-8 章 —— 本章是综合 + 实操
- 模块五 Agent Memory 学习路线 —— 工程基础
- 模块十九 实证审计学习路线 —— 方法论工具
关键论文
- 本模块作者论文 —— 12 周 PhD 第一篇 paper 的真实样本
- 模块二十 Ch7 5 篇 Diagnosis —— Diagnosis 路径的方法论参考
行业讨论
- ARR / EMNLP / NeurIPS 投稿流程 —— Memory 类论文最适合的 venue
- OpenReview 公开评审记录 —— 看类似主题论文如何被 review
框架文档(如适用)
- ACL Style Files:acl-org/acl-style-files
- OSF(Open Science Framework) —— 预注册托管
- HuggingFace LongMemEval / LoCoMo 数据 —— 跑 benchmark 的起点
走完 12 周路线,你会发现自己已经从”读论文焦虑”变成”评论论文 + 自己写论文”——这是本模块的最终目标。