第3章:阅读方法论——30 分钟读完一篇 Memory 论文
7 段切片法:abstract 1 分钟、figure-1 3 分钟、method 8 分钟、experiments 表 6 分钟、limitations 3 分钟、code-walk 7 分钟、note 2 分钟;skim vs deep read 判断树、Notion / Obsidian 笔记模板、reading group SOP
新人读 Memory 论文常陷入”1 篇 4 小时还没读完”的死循环——逐句啃 method、对每个公式硬刚。本章给一套 7 段切片法:1 分钟扫 abstract、3 分钟看 Figure 1、8 分钟啃 method 关键段、6 分钟读 experiments 主表、3 分钟扫 limitations、7 分钟做 code-walk、2 分钟写 1 段总结——30 分钟把一篇 Memory 论文吃透到”能在 reading group 讲 5 分钟”的程度。另附 skim vs deep-read 判断树、Notion / Obsidian 笔记模板、reading group 12 人 lab SOP。
📑 目录
- 1. 为什么需要”7 段切片法”
- 2. 7 段切片:30 分钟时间分配
- 3. skim vs deep-read 判断树
- 4. Notion / Obsidian 笔记模板
- 5. Reading Group SOP(12 人 lab 实操)
- 6. 高级技巧:code-walk 的具体打开方式
- ✅ 自我检验清单
- 📚 参考资料
1. 为什么需要”7 段切片法”
1.1 默认的”线性读法”为什么低效
abstract → intro → related work → method → experiments → conclusion
1分钟 10 分钟 15 分钟 30 分钟 20 分钟 5 分钟
─────────────────────────────────────────────────────── 81 分钟
问题:
- 80% 时间在 method 和 experiments,但 60% 内容是”包装”
- 没有 code-walk——代码里的关键信息(write trigger 实际逻辑)完全错过
- 线性读 = 读到 method 一半就忘了 intro 的动机
1.2 切片读法的逻辑
🍎 直觉:读论文不是读小说——不需要按顺序。先看高密度信号区:abstract(结论)、Figure 1(机制概览)、experiments 主表(数据)、code-walk(真相)。method 文字部分大多是低密度。
🌟 核心:30 分钟切片读法 = 把 80% 信息密度从 81 分钟压缩到 30 分钟,并且因为先看结论 / 数据 / 代码,理解深度反而更高。
2. 7 段切片:30 分钟时间分配
2.1 切片表
| # | 段 | 时间 | 抓什么 |
|---|---|---|---|
| 1 | Abstract | 1 分钟 | 主张 + 主端点 + 数字 |
| 2 | Figure 1(系统框图) | 3 分钟 | 机制 ASCII 化 |
| 3 | Method 关键段 | 8 分钟 | write trigger / read behavior |
| 4 | Experiments 主表 | 6 分钟 | baseline / Δ / paired? |
| 5 | Limitations | 3 分钟 | 作者承认的不足 |
| 6 | Code walk | 7 分钟 | repo 的 add / search / write 函数 |
| 7 | Note 1 段 | 2 分钟 | 用自己的话总结 |
| 合计 | 30 分钟 |
2.2 段 1:Abstract(1 分钟)
抓 3 个数字:
- 主端点是 acc / F1 / hit rate?
- baseline 是什么?
- Δ 多少?
⭕ 审计 trigger:如果 abstract 没说 baseline,直接 P3 跳过。
2.3 段 2:Figure 1(3 分钟)
画成 ASCII 框图(不画就不算读懂):
input ──→ [extract] ──→ [storage] ──→ [retrieve] ──→ answer
│
├─ when? (write trigger)
├─ what? (artifact type)
└─ where? (storage backend)
ASCII 化的同时回答 3 问题:
- 它的 write trigger 是什么?
- 它的 read behavior 是什么?
- 它的 storage backend 是什么?
2.4 段 3:Method 关键段(8 分钟)
不读全 method,只读:
- “Write Phase” / “Memory Construction” 段
- “Retrieval” / “Query Phase” 段
- 任何含关键公式 / 阈值 / hyperparameter的段
跳过:
- 大段叙事性描述
- 与 cognitive science 类比的段落(除非你研究方向就是 cognitive)
- 与 prior work 的对比叙述
2.5 段 4:Experiments 主表(6 分钟)
抓 4 件事:
| 抓什么 | 在哪 |
|---|---|
| baseline 是什么 | 主表第一行 / Methods §X |
| benchmark 是什么 | 表头 |
| Δ 数字 | 主表最右列 |
| paired 还是 unpaired | 表注 / 统计段 |
🌟 关键:如果论文报”+5 pp”但没说 paired,默认 unpaired(=可比性差)。
2.6 段 5:Limitations(3 分钟)
- 作者承认的 limitations 通常是 reviewer 关切的 60%
- 没有 limitations 段的论文是黄灯(作者不诚实)
2.7 段 6:Code walk(7 分钟)
打开 GitHub repo,搜以下关键词:
| 搜什么 | 抓什么 |
|---|---|
def add / def write / def insert | write trigger 的实际触发逻辑 |
def search / def retrieve / def query | retrieval 是 dense-only 还是 hybrid |
question_type / category | 是否使用 oracle |
judge / eval | judge 是 official 还是自家 |
threshold / tau / hyperparam | 是否有 dataset-tuned hyperparameter |
⭕ 不要逐行读代码,只要快速定位上面 5 类信息。
2.8 段 7:Note(2 分钟)
写 1 段 100-150 字的总结,覆盖:
- 是什么(system 一句话)
- 怎么做(write trigger + read behavior)
- 结果(Δ + baseline + paired?)
- 我的判断(P0/P1/P2/P3 + 为什么)
3. skim vs deep-read 判断树
拿到一篇论文
│
▼
读 abstract(30 秒)
│
├─ 是 survey / meta-work?
│ └→ 一律 deep-read(survey 是地图)
│
├─ benchmark 论文?
│ └→ 一律 deep-read(benchmark 是基础设施)
│
├─ 是我研究方向直接相关?
│ └→ deep-read(30 分钟切片法)
│
├─ 是同期 SOTA "我们 +X pp"?
│ ├─ paired 报了 + benchmark 标准 → skim(10 分钟)
│ └─ 没 paired / 自家 judge → P3 跳过
│
├─ 是 Diagnosis / critique 类?
│ └→ deep-read(信息密度最高)
│
└─ 是 1 周前刚出的预印本?
└→ 等 1 个月看引用 / 复现,再决定
🌟 核心:80% 论文应该 skim,10% deep-read,10% 跳过。深度阅读的预算要留给 P0 论文。
4. Notion / Obsidian 笔记模板
4.1 个人笔记模板(每篇一个)
# {Paper Title}
## Meta
- 作者 / 时间 / arXiv:
- 类型: [Survey / G1 / G2 / G3 / Benchmark / Diagnosis]
- 我的评级: [P0 / P1 / P2 / P3]
- 阅读时长:
## 30 字一句话
{用一句话讲清"它是什么"}
## 机制 ASCII
{Figure 1 翻译成 ASCII}
## Trigger × Read atlas 落点
- Write trigger: [input-driven / output-driven / failure-driven / scheduled / hybrid / oracle]
- Read behavior: [retrieval-only / adaptive / generative-on-read]
## 关键代码
- write 入口: `path/to/file.py:function()`
- retrieve 入口: `path/to/retrieve.py:function()`
- 是否使用 oracle: 是 / 否(哪一项)
## 实验数据
- benchmark:
- baseline:
- Δ:
- paired? p?
- positive control?
## 论文宣称 vs 真实水分
- 宣称: ...
- 水分: ...
## 与 G1 的传承
- 继承 G1 哪一篇:
- 创新点 vs 传承点:
## 30 秒 takeaway
{1 段 100-150 字}
## 后续追问
- 我看完后还想知道的:
- 我会写进自己论文 §2 的引用 hook:
4.2 Reading Index(全部论文的统一索引)
在 Notion / Obsidian 里维护一个 Database,列:
| Title | Year | Type | P-level | Atlas cell | One-liner |
|---|---|---|---|---|---|
| Mem0 | 2025 | G3 | P0 | input × retrieval | production-ready 标杆 |
| A-Mem | 2025 | G3 | P0 | output × gen-on-read | Zettelkasten fact graph |
| … |
🌟 效果:3 个月后回顾,1 分钟扫表能找到所有 P0 论文。
5. Reading Group SOP(12 人 lab 实操)
5.1 周频 SOP
周一 09:00: 老师 / 学长 在 Slack / 飞书 发本周必读 2 篇
周三 18:00: 每人提交 30 分钟切片读完的 note(个人笔记模板)
周五 14:00: 1 小时 reading group
├─ 15 分钟: 主讲人讲第 1 篇(5 min 机制 + 5 min 数据 + 5 min 批评)
├─ 15 分钟: 主讲人讲第 2 篇
├─ 20 分钟: 自由讨论(重点问"批评"和"对我们工作的启发")
└─ 10 分钟: 决定下周必读 + 每人挑选 1 篇 P1 自由读
5.2 主讲人 SOP
主讲人 5 分钟讲法:
第 1 分钟: 1 句话说论文做了什么("它在 LongMemEval 上做 RL trigger,+5 pp")
第 2-3 分钟: 把 Figure 1 在白板上画 ASCII
第 4 分钟: 讲核心数据(baseline / Δ / paired?)
第 5 分钟: 讲 1 个主要批评 + 1 个值得借鉴的点
5.3 自由讨论必问 3 问题
- “这篇的核心主张如果错,最可能错在哪?“(找漏洞)
- “这篇与上周读的 X 论文的差异是什么?“(建立对比)
- “如果我们做这个方向,应该把 baseline / benchmark / metric 设成什么?“(启发自己)
🌟 核心:reading group 的价值不是”复述论文”,是集体训练批判性思维 + 找出值得继续读 / 复现的论文。
6. 高级技巧:code-walk 的具体打开方式
6.1 7 分钟 code-walk 步骤
1. clone repo: git clone --depth=1 ...
2. 看 README.md 1 分钟
3. ls 顶层目录,找 main / src / agent 入口
4. 用 grep / IDE 搜以下关键词:
- "def add" / "def write" / "def insert"
- "def search" / "def retrieve"
- "question_type" / "oracle"
- "judge" / "score"
- "threshold" / "tau"
5. 跳进每个函数,读 20 行
6. 截图 / 复制关键 5-10 行到 note
6.2 不需要 code-walk 的情况
- Survey 论文(无代码)
- benchmark 论文(看官方 eval 即可)
- 你已经决定 P3 跳过
6.3 必须 code-walk 的情况
- 任何 G3 论文(80% 关键信息在代码)
- 任何”adaptive” / “selective” / “agentic”叙事的论文(要看实际是不是 oracle)
- 你计划复现 / 对比的论文
✅ 自我检验清单
- 能在 30 分钟内读完一篇陌生 Memory 论文并写出 1 段总结
- 能用判断树决定一篇论文是 skim 还是 deep-read 还是 P3 跳过
- 已建立自己的 Notion / Obsidian 笔记模板并实践 10+ 篇论文
- 能在 reading group 上 5 分钟讲清陌生论文
- 能在 7 分钟 code-walk 中定位 write trigger / retrieve 关键函数
- 能区分”必须 code-walk”和”不必 code-walk”的论文类型
- 已设置 Reading Index Database,含全部已读论文
- 能为自己的 lab 写 reading group SOP
📚 参考资料
概念入门
- 本路线第 1 章 优先级矩阵 —— 决定哪些论文进 deep-read
- 本路线第 2 章 Survey —— Survey 一律 deep-read 的理由
- 3-pass reading method(Keshav, 2007) —— 工业界论文阅读经典 3-pass 方法(abstract / structure / depth),本章在其基础上加入 code-walk
关键论文
- 本模块作者论文 —— code-walk 在 atlas 化中的实操样本
- 任意 5 篇 G3 SOTA —— 在 30 分钟切片法下练手
行业讨论
- Notion / Obsidian 用户分享的 paper reading workflow —— GitHub 搜 “obsidian paper template”
- lab reading group 经验帖 —— 多个名校 NLP lab 公开过 SOP
框架文档(如适用)
- Notion / Obsidian:notion.so / obsidian.md
- VSCode + 代码 grep / ripgrep —— code-walk 的工具