第3章：阅读方法论——30 分钟读完一篇 Memory 论文

新人读 Memory 论文常陷入”1 篇 4 小时还没读完”的死循环——逐句啃 method、对每个公式硬刚。本章给一套 7 段切片法：1 分钟扫 abstract、3 分钟看 Figure 1、8 分钟啃 method 关键段、6 分钟读 experiments 主表、3 分钟扫 limitations、7 分钟做 code-walk、2 分钟写 1 段总结——30 分钟把一篇 Memory 论文吃透到”能在 reading group 讲 5 分钟”的程度。另附 skim vs deep-read 判断树、Notion / Obsidian 笔记模板、reading group 12 人 lab SOP。

1. 为什么需要”7 段切片法”

1.1 默认的”线性读法”为什么低效

abstract → intro → related work → method → experiments → conclusion
   1分钟    10 分钟   15 分钟      30 分钟    20 分钟       5 分钟
   ─────────────────────────────────────────────────────── 81 分钟

问题：

80% 时间在 method 和 experiments，但 60% 内容是”包装”
没有 code-walk——代码里的关键信息（write trigger 实际逻辑）完全错过
线性读 = 读到 method 一半就忘了 intro 的动机

#	段	时间	抓什么
1	Abstract	1 分钟	主张 + 主端点 + 数字
2	Figure 1（系统框图）	3 分钟	机制 ASCII 化
3	Method 关键段	8 分钟	write trigger / read behavior
4	Experiments 主表	6 分钟	baseline / Δ / paired?
5	Limitations	3 分钟	作者承认的不足
6	Code walk	7 分钟	repo 的 add / search / write 函数
7	Note 1 段	2 分钟	用自己的话总结
合计		30 分钟

2.2 段 1：Abstract（1 分钟）

抓 3 个数字：

主端点是 acc / F1 / hit rate？
baseline 是什么？
Δ 多少？

⭕ 审计 trigger：如果 abstract 没说 baseline，直接 P3 跳过。

2.3 段 2：Figure 1（3 分钟）

画成 ASCII 框图（不画就不算读懂）：

input ──→ [extract] ──→ [storage] ──→ [retrieve] ──→ answer
              │
              ├─ when?  (write trigger)
              ├─ what?  (artifact type)
              └─ where? (storage backend)

ASCII 化的同时回答 3 问题：

它的 write trigger 是什么？
它的 read behavior 是什么？
它的 storage backend 是什么？

2.4 段 3：Method 关键段（8 分钟）

不读全 method，只读：

“Write Phase” / “Memory Construction” 段
“Retrieval” / “Query Phase” 段
任何含关键公式 / 阈值 / hyperparameter的段

跳过：

大段叙事性描述
与 cognitive science 类比的段落（除非你研究方向就是 cognitive）
与 prior work 的对比叙述

2.5 段 4：Experiments 主表（6 分钟）

抓 4 件事：

抓什么	在哪
baseline 是什么	主表第一行 / Methods §X
benchmark 是什么	表头
Δ 数字	主表最右列
paired 还是 unpaired	表注 / 统计段

🌟 关键：如果论文报”+5 pp”但没说 paired，默认 unpaired（=可比性差）。

2.6 段 5：Limitations（3 分钟）

作者承认的 limitations 通常是 reviewer 关切的 60%
没有 limitations 段的论文是黄灯（作者不诚实）

2.7 段 6：Code walk（7 分钟）

打开 GitHub repo，搜以下关键词：

搜什么	抓什么
`def add` / `def write` / `def insert`	write trigger 的实际触发逻辑
`def search` / `def retrieve` / `def query`	retrieval 是 dense-only 还是 hybrid
`question_type` / `category`	是否使用 oracle
`judge` / `eval`	judge 是 official 还是自家
`threshold` / `tau` / `hyperparam`	是否有 dataset-tuned hyperparameter

⭕ 不要逐行读代码，只要快速定位上面 5 类信息。

2.8 段 7：Note（2 分钟）

写 1 段 100-150 字的总结，覆盖：

是什么（system 一句话）
怎么做（write trigger + read behavior）
结果（Δ + baseline + paired?）
我的判断（P0/P1/P2/P3 + 为什么）

3. skim vs deep-read 判断树

拿到一篇论文
   │
   ▼
读 abstract（30 秒）
   │
   ├─ 是 survey / meta-work？
   │       └→ 一律 deep-read（survey 是地图）
   │
   ├─ benchmark 论文？
   │       └→ 一律 deep-read（benchmark 是基础设施）
   │
   ├─ 是我研究方向直接相关？
   │       └→ deep-read（30 分钟切片法）
   │
   ├─ 是同期 SOTA "我们 +X pp"？
   │       ├─ paired 报了 + benchmark 标准 → skim（10 分钟）
   │       └─ 没 paired / 自家 judge        → P3 跳过
   │
   ├─ 是 Diagnosis / critique 类？
   │       └→ deep-read（信息密度最高）
   │
   └─ 是 1 周前刚出的预印本？
           └→ 等 1 个月看引用 / 复现，再决定

🌟 核心：80% 论文应该 skim，10% deep-read，10% 跳过。深度阅读的预算要留给 P0 论文。

4. Notion / Obsidian 笔记模板

4.1 个人笔记模板（每篇一个）

# {Paper Title}

## Meta
- 作者 / 时间 / arXiv:
- 类型: [Survey / G1 / G2 / G3 / Benchmark / Diagnosis]
- 我的评级: [P0 / P1 / P2 / P3]
- 阅读时长:

## 30 字一句话
{用一句话讲清"它是什么"}

## 机制 ASCII
{Figure 1 翻译成 ASCII}

## Trigger × Read atlas 落点
- Write trigger: [input-driven / output-driven / failure-driven / scheduled / hybrid / oracle]
- Read behavior: [retrieval-only / adaptive / generative-on-read]

## 关键代码
- write 入口: `path/to/file.py:function()`
- retrieve 入口: `path/to/retrieve.py:function()`
- 是否使用 oracle: 是 / 否（哪一项）

## 实验数据
- benchmark:
- baseline:
- Δ:
- paired? p?
- positive control?

## 论文宣称 vs 真实水分
- 宣称: ...
- 水分: ...

## 与 G1 的传承
- 继承 G1 哪一篇:
- 创新点 vs 传承点:

## 30 秒 takeaway
{1 段 100-150 字}

## 后续追问
- 我看完后还想知道的:
- 我会写进自己论文 §2 的引用 hook:

4.2 Reading Index（全部论文的统一索引）

在 Notion / Obsidian 里维护一个 Database，列：

Title	Year	Type	P-level	Atlas cell	One-liner
Mem0	2025	G3	P0	input × retrieval	production-ready 标杆
A-Mem	2025	G3	P0	output × gen-on-read	Zettelkasten fact graph
…

🌟 效果：3 个月后回顾，1 分钟扫表能找到所有 P0 论文。

5. Reading Group SOP（12 人 lab 实操）

5.1 周频 SOP

周一 09:00: 老师 / 学长 在 Slack / 飞书 发本周必读 2 篇
周三 18:00: 每人提交 30 分钟切片读完的 note（个人笔记模板）
周五 14:00: 1 小时 reading group
            ├─ 15 分钟: 主讲人讲第 1 篇（5 min 机制 + 5 min 数据 + 5 min 批评）
            ├─ 15 分钟: 主讲人讲第 2 篇
            ├─ 20 分钟: 自由讨论（重点问"批评"和"对我们工作的启发"）
            └─ 10 分钟: 决定下周必读 + 每人挑选 1 篇 P1 自由读

5.2 主讲人 SOP

主讲人 5 分钟讲法：

第 1 分钟: 1 句话说论文做了什么（"它在 LongMemEval 上做 RL trigger，+5 pp"）
第 2-3 分钟: 把 Figure 1 在白板上画 ASCII
第 4 分钟: 讲核心数据（baseline / Δ / paired?）
第 5 分钟: 讲 1 个主要批评 + 1 个值得借鉴的点

5.3 自由讨论必问 3 问题

“这篇的核心主张如果错，最可能错在哪？“（找漏洞）
“这篇与上周读的 X 论文的差异是什么？“（建立对比）
“如果我们做这个方向，应该把 baseline / benchmark / metric 设成什么？“（启发自己）

🌟 核心：reading group 的价值不是”复述论文”，是集体训练批判性思维 + 找出值得继续读 / 复现的论文。

6. 高级技巧：code-walk 的具体打开方式

6.1 7 分钟 code-walk 步骤

1. clone repo: git clone --depth=1 ...
2. 看 README.md 1 分钟
3. ls 顶层目录，找 main / src / agent 入口
4. 用 grep / IDE 搜以下关键词:
   - "def add" / "def write" / "def insert"
   - "def search" / "def retrieve"
   - "question_type" / "oracle"
   - "judge" / "score"
   - "threshold" / "tau"
5. 跳进每个函数，读 20 行
6. 截图 / 复制关键 5-10 行到 note

6.2 不需要 code-walk 的情况

Survey 论文（无代码）
benchmark 论文（看官方 eval 即可）
你已经决定 P3 跳过

6.3 必须 code-walk 的情况

任何 G3 论文（80% 关键信息在代码）
任何”adaptive” / “selective” / “agentic”叙事的论文（要看实际是不是 oracle）
你计划复现 / 对比的论文

✅ 自我检验清单

能在 30 分钟内读完一篇陌生 Memory 论文并写出 1 段总结
能用判断树决定一篇论文是 skim 还是 deep-read 还是 P3 跳过
已建立自己的 Notion / Obsidian 笔记模板并实践 10+ 篇论文
能在 reading group 上 5 分钟讲清陌生论文
能在 7 分钟 code-walk 中定位 write trigger / retrieve 关键函数
能区分”必须 code-walk”和”不必 code-walk”的论文类型
已设置 Reading Index Database，含全部已读论文
能为自己的 lab 写 reading group SOP

📚 参考资料

概念入门

本路线第 1 章优先级矩阵 —— 决定哪些论文进 deep-read
本路线第 2 章 Survey —— Survey 一律 deep-read 的理由
3-pass reading method（Keshav, 2007） —— 工业界论文阅读经典 3-pass 方法（abstract / structure / depth），本章在其基础上加入 code-walk

关键论文

本模块作者论文 —— code-walk 在 atlas 化中的实操样本
任意 5 篇 G3 SOTA —— 在 30 分钟切片法下练手

行业讨论

Notion / Obsidian 用户分享的 paper reading workflow —— GitHub 搜 “obsidian paper template”
lab reading group 经验帖 —— 多个名校 NLP lab 公开过 SOP

框架文档（如适用）

Notion / Obsidian：notion.so / obsidian.md
VSCode + 代码 grep / ripgrep —— code-walk 的工具