第9章：阅读路线与端到端——从读到复现到写自己的

前 8 章给了你”地图、工具、40+ 篇精读卡”。本章把这些资源拼成可执行的周计划：3 周快速入门、8 周扎实路线、12 周深度路线各自的 detailed 任务清单；reading group 的 SOP；从”读论文”到”复现 benchmark”到”写自己的论文”三阶段过渡指南；以及如何用本路线 + 模块五（工程构建）+ 模块十九（实证审计）三个模块协同拼出一篇 ARR / EMNLP 投稿。

📑 目录

1. 3 周快速入门 detailed 周计划
2. 8 周扎实路线 detailed 周计划
3. 12 周深度路线 detailed 周计划
4. 三阶段过渡：从读到复现到写
5. 三模块协同：本路线 + 模块五 + 模块十九
6. PhD 选题决策树
✅ 自我检验清单
📚 参考资料

1. 3 周快速入门 detailed 周计划

目标：能在面试 / lab 入组面谈中流畅讨论 Memory 赛道。

Week 1：地图 + 工具

Day	任务	时长
1	本路线第 1 章（论文地图）+ 第 3 章（30 分钟切片法）	2 h
2	本路线第 2 章 CoALA 精读	1.5 h
3	本路线第 2 章 MemOS 精读	1.5 h
4	本路线第 2 章 Memory Survey 2025 浏览	1 h
5	本路线第 2 章 Anatomy of Agentic Memory 精读	1.5 h
6-7	建立个人 Notion / Obsidian 笔记模板 + 整理 4 篇 survey 术语词典	2 h

Week 1 产出：完整的 20 术语词典 + 4 篇 survey 笔记。

Week 2：G1 + 部分 G3

Day	任务	时长
1-2	G1 5 篇精读（MemGPT / Generative Agents / HippoRAG / MemoryBank / ReadAgent）	4 h
3	Mem0 精读 + 浏览 GitHub	1.5 h
4	A-Mem 精读 + 浏览 GitHub	1.5 h
5	MemoryOS 精读	1.5 h
6	SimpleMem + LightMem 精读	2 h
7	整理 G1-G3 传承图（手画或 ASCII）	1 h

Week 2 产出：能讲清”G3 的每个设计选择都来自 G1 哪一篇”。

Week 3：Benchmark + Diagnosis

Day	任务	时长
1	LongMemEval 精读 + 下载数据 + 跑 1 个 sanity query	2 h
2	LoCoMo 精读 + 下载数据	1.5 h
3	MemBench + MEMTRACK 浏览	1 h
4	Yuan’26 Diagnosing Retrieval vs Utilization 精读	1.5 h
5	本模块作者论文（Cache Hits Don’t Save）精读	2 h
6	整理”我感兴趣的 5 个论文”列表	1 h
7	准备 5 分钟 talk：“我对 Agent Memory 赛道的理解”	1 h

Week 3 产出：能在 lab 面谈中讲 5 分钟 + 给面试官提 3 个有深度的问题。

2. 8 周扎实路线 detailed 周计划

目标：能讲完整 Agent Memory 综述 1 小时 + 能复现 1 个系统。

周	主任务	子任务
1	3 周路线 Week 1 加速版	同上
2	G1 5 篇 deep-read	全部 30 分钟切片 + code-walk
3	G3 前 6 篇（Mem0 / A-Mem / MemoryOS / LightMem / EMem / SimpleMem）	同上 + atlas 卡片
4	G3 后 5 篇（Memori / LiCoMemory / Nemori / D-MEM / Selective Memory）	同上
5	4 个 benchmark 全部精读 + 跑通 LongMemEval-S 1 个 baseline	模块十九 Ch8 §3-4
6	5 篇 Diagnosis 类全部精读	重点：本模块作者论文 + Anatomy
7	选 1 个 G3 系统，clone repo + 在 LongMemEval 上跑 paired vs C1	模块十九 Ch4 工具
8	准备 1 小时 Agent Memory survey talk + 建立 lab reading group SOP	本章 §6

8 周产出：

完整 40 篇精读笔记
能在 LongMemEval 上复现 1 个 G3 系统并跑 paired 配对
lab 内 reading group 启动

3. 12 周深度路线 detailed 周计划

目标：一篇可投 ARR / EMNLP / NeurIPS 的初稿。

周	任务
1-4	同 8 周路线 1-5 周加速版（4 周吃完 40 篇）
5	选 1 个开放问题（参考模块十九 Ch2 §6 OP1-OP5 或本路线 Ch8 §6 OP-RL/MA/MM）
6	写 EXPERIMENTS_PREREG.md + DEVIATIONS.md（模块十九 Ch4）
7-8	跑 LongMemEval-S H1a × 4 backbone（模块十九 Ch6 + Ch8）
9	跑 LoCoMo H1b primary + sanity（模块十九 Ch8 §6）
10	跑 C+oracle positive control（模块十九 Ch5）
11	论文骨架（ACL template）+ abstract + intro + experiments
12	discussion + limitations + 第一轮 GPT-5.4 review + 修订

12 周产出：

ARR 可投初稿（含 6.5/10+ 评分目标）
完整开源代码 + EXPERIMENTS_PREREG + DEVIATIONS
11 系统 atlas 卡片

4. 三阶段过渡：从读到复现到写

        Stage 1: Reading       Stage 2: Reproducing      Stage 3: Writing
        ─────────────────      ─────────────────────     ──────────────────
         40+ 篇 atlas 笔记 →    跑通 1-2 个 G3 系统 →    写自己的 paper

Skills:   30 分钟切片法            paired McNemar              EXPERIMENTS_PREREG
         code-walk             cluster bootstrap         positive control
         atlas 化              cumulative-effect plot    DEVIATIONS 诚实披露

4.1 Stage 1 → Stage 2 过渡

触发条件：你已经能为 11 个 G3 系统每个写出 200 字 atlas 卡片。

第一个复现项目建议：

用 SimpleMem（最简单）或 Mem0（最完整）
在 LongMemEval-S 跑 100 题 sanity
输出：与 C1 zero-build retrieval 的 paired Δ

4.2 Stage 2 → Stage 3 过渡

触发条件：你已经跑通 1 个 paired benchmark 评测 + 能写出 EXPERIMENTS_PREREG.md。

第一篇论文建议：

不要做”我提出新方法”——做 Diagnosis（参考模块十九 Ch7）
选一个 G3 系统 + 一个 critique 视角（如”它的 reflection trigger 是否真有用”）
把模块十九的 6 步范式做齐

🌟 核心：Reading → Reproducing → Writing 三阶段，预计 PhD 第一年走完。本路线 + 模块五 + 模块十九给你完整工具链。

5. 三模块协同：本路线 + 模块五 + 模块十九

三个模块解决不同子任务，协同使用效率最高：

┌─────────────────────────────────────────────────────────────┐
│  模块五 Agent Memory                                         │
│  ↓ 教你 "Memory 是什么 / 怎么造"                             │
│  适用于：第一次接触 Memory 的工程实现                        │
└─────────────────────────────────────────────────────────────┘
              │
              ▼ 入门后
┌─────────────────────────────────────────────────────────────┐
│  模块二十（本路线） 论文演进与综述精读                       │
│  ↓ 教你 "Memory 论文怎么读 / 怎么吸收文献"                  │
│  适用于：研究入门、PhD 准备选题、reading group 启动          │
└─────────────────────────────────────────────────────────────┘
              │
              ▼ 选定方向后
┌─────────────────────────────────────────────────────────────┐
│  模块十九 实证审计与负结果方法论                              │
│  ↓ 教你 "Memory 论文怎么审 / 自己怎么写实证论文"            │
│  适用于：审稿、reproducibility 评估、写自己的 paper         │
└─────────────────────────────────────────────────────────────┘

5.1 12 周 ARR 投稿的三模块协同

周	主任务	主用模块
1-4	吃透文献 + 选方向	模块二十
5	写 PREREG	模块十九 Ch4
6-7	跑 H1a × 4 backbone	模块十九 Ch6
8	跑 H1b	模块十九 Ch8
9	跑 positive control	模块十九 Ch5
10	论文骨架	模块十九 Ch8 §9
11-12	写 + review + 修订	模块十九 + 模块二十 Ch5（看自己怎么被审）

🌟 核心：不要只用一个模块。模块五给基础概念，模块二十给文献和方向，模块十九给方法论严谨。三个加起来才是完整的”PhD 第一年”。

6. PhD 选题决策树

你想做 Agent Memory 方向 PhD？
   │
   ▼
你倾向 SOTA（提出新方法）还是 Diagnosis（揭真相）？
   │
   ├─ SOTA 路径（"我做了个更聪明的 trigger"）
   │     ├─ 难度：高（要打过所有同期 G3 系统）
   │     ├─ 时间：18-24 个月一篇 paper
   │     ├─ 失败风险：高（被同期工作 frontrun）
   │     └─ 建议方向：Memory × RL 或 Memory × Multi-Agent（mainstream 空间小）
   │
   └─ Diagnosis 路径（"我证明大家信错了"）
         ├─ 难度：中（严格方法论即可，不需打过 SOTA）
         ├─ 时间：6-12 个月一篇 paper
         ├─ 失败风险：低（揭真相本身就是贡献）
         └─ 建议方向：本路线 Ch7 的 5 篇 Diagnosis 风格 +
                      自己选一个未被审计的 G3 子方向

🌟 本模块作者建议：PhD 第一篇 paper 走 Diagnosis 路径，第二篇可以选 SOTA。理由：

Diagnosis 教你方法论（一生受用）
SOTA 教你工程（也有用，但短期）
先方法论后工程 = 更稳的学术轨迹

✅ 自我检验清单

能为自己的当下目标（快速入门 / PhD 选题 / ARR 投稿）选合适的周计划
能在 lab 里组织 12 人 reading group 并写 SOP（参考第 3 章 §5）
能从 P0 10 篇中选 1 篇跑通它的 GitHub repo（Reproducing 起步）
能用本模块 + 模块五 + 模块十九三个模块的工具凑出 ARR 投稿 12 周流程
能为下一年读到的 30+ 篇新论文给出 P0/P1/P2/P3 评级
能为自己写出 EXPERIMENTS_PREREG.md 启动 pilot 实验
能在 SOTA vs Diagnosis 路径决策上做出有自己理由的选择

📚 参考资料

概念入门

本路线第 1-8 章 —— 本章是综合 + 实操
模块五 Agent Memory 学习路线 —— 工程基础
模块十九实证审计学习路线 —— 方法论工具

关键论文

本模块作者论文 —— 12 周 PhD 第一篇 paper 的真实样本
模块二十 Ch7 5 篇 Diagnosis —— Diagnosis 路径的方法论参考

行业讨论

ARR / EMNLP / NeurIPS 投稿流程 —— Memory 类论文最适合的 venue
OpenReview 公开评审记录 —— 看类似主题论文如何被 review

框架文档（如适用）

ACL Style Files：acl-org/acl-style-files
OSF（Open Science Framework） —— 预注册托管
HuggingFace LongMemEval / LoCoMo 数据 —— 跑 benchmark 的起点

走完 12 周路线，你会发现自己已经从”读论文焦虑”变成”评论论文 + 自己写论文”——这是本模块的最终目标。

搜索