跳到主要内容
Agent Memory 论文演进与综述精读

第3章:阅读方法论——30 分钟读完一篇 Memory 论文

7 段切片法:abstract 1 分钟、figure-1 3 分钟、method 8 分钟、experiments 表 6 分钟、limitations 3 分钟、code-walk 7 分钟、note 2 分钟;skim vs deep read 判断树、Notion / Obsidian 笔记模板、reading group SOP

阅读方法论 skim deep read reading group Notion Obsidian

新人读 Memory 论文常陷入”1 篇 4 小时还没读完”的死循环——逐句啃 method、对每个公式硬刚。本章给一套 7 段切片法:1 分钟扫 abstract、3 分钟看 Figure 1、8 分钟啃 method 关键段、6 分钟读 experiments 主表、3 分钟扫 limitations、7 分钟做 code-walk、2 分钟写 1 段总结——30 分钟把一篇 Memory 论文吃透到”能在 reading group 讲 5 分钟”的程度。另附 skim vs deep-read 判断树、Notion / Obsidian 笔记模板、reading group 12 人 lab SOP。

📑 目录


1. 为什么需要”7 段切片法”

1.1 默认的”线性读法”为什么低效

abstract → intro → related work → method → experiments → conclusion
   1分钟    10 分钟   15 分钟      30 分钟    20 分钟       5 分钟
   ─────────────────────────────────────────────────────── 81 分钟

问题:

  • 80% 时间在 method 和 experiments,但 60% 内容是”包装”
  • 没有 code-walk——代码里的关键信息(write trigger 实际逻辑)完全错过
  • 线性读 = 读到 method 一半就忘了 intro 的动机

1.2 切片读法的逻辑

🍎 直觉:读论文不是读小说——不需要按顺序。先看高密度信号区:abstract(结论)、Figure 1(机制概览)、experiments 主表(数据)、code-walk(真相)。method 文字部分大多是低密度。

🌟 核心30 分钟切片读法 = 把 80% 信息密度从 81 分钟压缩到 30 分钟,并且因为先看结论 / 数据 / 代码,理解深度反而更高


2. 7 段切片:30 分钟时间分配

2.1 切片表

#时间抓什么
1Abstract1 分钟主张 + 主端点 + 数字
2Figure 1(系统框图)3 分钟机制 ASCII 化
3Method 关键段8 分钟write trigger / read behavior
4Experiments 主表6 分钟baseline / Δ / paired?
5Limitations3 分钟作者承认的不足
6Code walk7 分钟repo 的 add / search / write 函数
7Note 1 段2 分钟用自己的话总结
合计30 分钟

2.2 段 1:Abstract(1 分钟)

抓 3 个数字

  • 主端点是 acc / F1 / hit rate?
  • baseline 是什么?
  • Δ 多少?

审计 trigger:如果 abstract 没说 baseline,直接 P3 跳过。

2.3 段 2:Figure 1(3 分钟)

画成 ASCII 框图(不画就不算读懂):

input ──→ [extract] ──→ [storage] ──→ [retrieve] ──→ answer

              ├─ when?  (write trigger)
              ├─ what?  (artifact type)
              └─ where? (storage backend)

ASCII 化的同时回答 3 问题:

  1. 它的 write trigger 是什么?
  2. 它的 read behavior 是什么?
  3. 它的 storage backend 是什么?

2.4 段 3:Method 关键段(8 分钟)

不读全 method,只读:

  • “Write Phase” / “Memory Construction” 段
  • “Retrieval” / “Query Phase” 段
  • 任何含关键公式 / 阈值 / hyperparameter的段

跳过:

  • 大段叙事性描述
  • 与 cognitive science 类比的段落(除非你研究方向就是 cognitive)
  • 与 prior work 的对比叙述

2.5 段 4:Experiments 主表(6 分钟)

抓 4 件事:

抓什么在哪
baseline 是什么主表第一行 / Methods §X
benchmark 是什么表头
Δ 数字主表最右列
paired 还是 unpaired表注 / 统计段

🌟 关键:如果论文报”+5 pp”但没说 paired默认 unpaired(=可比性差)。

2.6 段 5:Limitations(3 分钟)

  • 作者承认的 limitations 通常是 reviewer 关切的 60%
  • 没有 limitations 段的论文是黄灯(作者不诚实)

2.7 段 6:Code walk(7 分钟)

打开 GitHub repo,搜以下关键词:

搜什么抓什么
def add / def write / def insertwrite trigger 的实际触发逻辑
def search / def retrieve / def queryretrieval 是 dense-only 还是 hybrid
question_type / category是否使用 oracle
judge / evaljudge 是 official 还是自家
threshold / tau / hyperparam是否有 dataset-tuned hyperparameter

不要逐行读代码,只要快速定位上面 5 类信息。

2.8 段 7:Note(2 分钟)

写 1 段 100-150 字的总结,覆盖:

  • 是什么(system 一句话)
  • 怎么做(write trigger + read behavior)
  • 结果(Δ + baseline + paired?)
  • 我的判断(P0/P1/P2/P3 + 为什么)

3. skim vs deep-read 判断树

拿到一篇论文


读 abstract(30 秒)

   ├─ 是 survey / meta-work?
   │       └→ 一律 deep-read(survey 是地图)

   ├─ benchmark 论文?
   │       └→ 一律 deep-read(benchmark 是基础设施)

   ├─ 是我研究方向直接相关?
   │       └→ deep-read(30 分钟切片法)

   ├─ 是同期 SOTA "我们 +X pp"?
   │       ├─ paired 报了 + benchmark 标准 → skim(10 分钟)
   │       └─ 没 paired / 自家 judge        → P3 跳过

   ├─ 是 Diagnosis / critique 类?
   │       └→ deep-read(信息密度最高)

   └─ 是 1 周前刚出的预印本?
           └→ 等 1 个月看引用 / 复现,再决定

🌟 核心80% 论文应该 skim,10% deep-read,10% 跳过。深度阅读的预算要留给 P0 论文。


4. Notion / Obsidian 笔记模板

4.1 个人笔记模板(每篇一个)

# {Paper Title}

## Meta
- 作者 / 时间 / arXiv:
- 类型: [Survey / G1 / G2 / G3 / Benchmark / Diagnosis]
- 我的评级: [P0 / P1 / P2 / P3]
- 阅读时长:

## 30 字一句话
{用一句话讲清"它是什么"}

## 机制 ASCII
{Figure 1 翻译成 ASCII}

## Trigger × Read atlas 落点
- Write trigger: [input-driven / output-driven / failure-driven / scheduled / hybrid / oracle]
- Read behavior: [retrieval-only / adaptive / generative-on-read]

## 关键代码
- write 入口: `path/to/file.py:function()`
- retrieve 入口: `path/to/retrieve.py:function()`
- 是否使用 oracle: 是 / 否(哪一项)

## 实验数据
- benchmark:
- baseline:
- Δ:
- paired? p?
- positive control?

## 论文宣称 vs 真实水分
- 宣称: ...
- 水分: ...

## 与 G1 的传承
- 继承 G1 哪一篇:
- 创新点 vs 传承点:

## 30 秒 takeaway
{1 段 100-150 字}

## 后续追问
- 我看完后还想知道的:
- 我会写进自己论文 §2 的引用 hook:

4.2 Reading Index(全部论文的统一索引)

在 Notion / Obsidian 里维护一个 Database,列:

TitleYearTypeP-levelAtlas cellOne-liner
Mem02025G3P0input × retrievalproduction-ready 标杆
A-Mem2025G3P0output × gen-on-readZettelkasten fact graph

🌟 效果:3 个月后回顾,1 分钟扫表能找到所有 P0 论文。


5. Reading Group SOP(12 人 lab 实操)

5.1 周频 SOP

周一 09:00: 老师 / 学长 在 Slack / 飞书 发本周必读 2 篇
周三 18:00: 每人提交 30 分钟切片读完的 note(个人笔记模板)
周五 14:00: 1 小时 reading group
            ├─ 15 分钟: 主讲人讲第 1 篇(5 min 机制 + 5 min 数据 + 5 min 批评)
            ├─ 15 分钟: 主讲人讲第 2 篇
            ├─ 20 分钟: 自由讨论(重点问"批评"和"对我们工作的启发")
            └─ 10 分钟: 决定下周必读 + 每人挑选 1 篇 P1 自由读

5.2 主讲人 SOP

主讲人 5 分钟讲法:

第 1 分钟: 1 句话说论文做了什么("它在 LongMemEval 上做 RL trigger,+5 pp")
第 2-3 分钟: 把 Figure 1 在白板上画 ASCII
第 4 分钟: 讲核心数据(baseline / Δ / paired?)
第 5 分钟: 讲 1 个主要批评 + 1 个值得借鉴的点

5.3 自由讨论必问 3 问题

  1. “这篇的核心主张如果错,最可能错在哪?“(找漏洞)
  2. “这篇与上周读的 X 论文的差异是什么?“(建立对比)
  3. “如果我们做这个方向,应该把 baseline / benchmark / metric 设成什么?“(启发自己)

🌟 核心:reading group 的价值不是”复述论文”,是集体训练批判性思维 + 找出值得继续读 / 复现的论文


6. 高级技巧:code-walk 的具体打开方式

6.1 7 分钟 code-walk 步骤

1. clone repo: git clone --depth=1 ...
2. 看 README.md 1 分钟
3. ls 顶层目录,找 main / src / agent 入口
4. 用 grep / IDE 搜以下关键词:
   - "def add" / "def write" / "def insert"
   - "def search" / "def retrieve"
   - "question_type" / "oracle"
   - "judge" / "score"
   - "threshold" / "tau"
5. 跳进每个函数,读 20 行
6. 截图 / 复制关键 5-10 行到 note

6.2 不需要 code-walk 的情况

  • Survey 论文(无代码)
  • benchmark 论文(看官方 eval 即可)
  • 你已经决定 P3 跳过

6.3 必须 code-walk 的情况

  • 任何 G3 论文(80% 关键信息在代码)
  • 任何”adaptive” / “selective” / “agentic”叙事的论文(要看实际是不是 oracle)
  • 你计划复现 / 对比的论文

✅ 自我检验清单

  • 能在 30 分钟内读完一篇陌生 Memory 论文并写出 1 段总结
  • 能用判断树决定一篇论文是 skim 还是 deep-read 还是 P3 跳过
  • 已建立自己的 Notion / Obsidian 笔记模板并实践 10+ 篇论文
  • 能在 reading group 上 5 分钟讲清陌生论文
  • 能在 7 分钟 code-walk 中定位 write trigger / retrieve 关键函数
  • 能区分”必须 code-walk”和”不必 code-walk”的论文类型
  • 已设置 Reading Index Database,含全部已读论文
  • 能为自己的 lab 写 reading group SOP

📚 参考资料

概念入门

  • 本路线第 1 章 优先级矩阵 —— 决定哪些论文进 deep-read
  • 本路线第 2 章 Survey —— Survey 一律 deep-read 的理由
  • 3-pass reading method(Keshav, 2007) —— 工业界论文阅读经典 3-pass 方法(abstract / structure / depth),本章在其基础上加入 code-walk

关键论文

  • 本模块作者论文 —— code-walk 在 atlas 化中的实操样本
  • 任意 5 篇 G3 SOTA —— 在 30 分钟切片法下练手

行业讨论

  • Notion / Obsidian 用户分享的 paper reading workflow —— GitHub 搜 “obsidian paper template”
  • lab reading group 经验帖 —— 多个名校 NLP lab 公开过 SOP

框架文档(如适用)

  • Notion / Obsidiannotion.so / obsidian.md
  • VSCode + 代码 grep / ripgrep —— code-walk 的工具