章节目录
把 100+ 篇 Agent Memory 论文压成一张地图:按代次(G1/G2/G3)、按问题域(write trigger / retrieval / consolidation / forgetting / evaluation)、按 venue / 按重要性四种 view 各看一遍;给「先读哪些、后读哪些、跳过哪些」的优先级矩阵;新人 30 分钟得到全局观
CoALA(Cognitive Architectures for Language Agents)、MemOS(Memory OS for AI System)、Memory Survey 2025、Anatomy of Agentic Memory 四篇 meta-work 逐篇精读:每篇含贡献、taxonomy 框架、与其他 survey 的差异、给读者的最大 takeaway;读完这一章,整个 Agent Memory 赛道的「地图」和「术语词典」全部到手
7 段切片法:abstract 1 分钟、figure-1 3 分钟、method 8 分钟、experiments 表 6 分钟、limitations 3 分钟、code-walk 7 分钟、note 2 分钟;skim vs deep read 判断树、Notion / Obsidian 笔记模板、reading group SOP
5 篇 2023-2024 G1/G2 过渡期奠基论文逐篇深读:每篇含动机、核心机制(含 ASCII 框图)、关键代码位置、批评、对 G3 时代的影响;MemGPT 的 OS 隐喻、Generative Agents 的 reflection trigger、HippoRAG 的海马体类比、MemoryBank 的 Ebbinghaus 衰减、ReadAgent 的 gist memory
11 个 2024-2026 G2/G3 SOTA 系统逐篇深读:动机 / 机制(含 ASCII 框图)/ write trigger / read behavior / 关键代码位置 / 数据 / 批评 / 与 G1 传承关系
4 个 Agent Memory 主流 benchmark 论文逐篇深读:数据构造方式、ability 类别 / question type、官方 judge 实现、known limitations、与其他 benchmark 的对比;为什么读用 benchmark 的论文之前必须读 benchmark 论文本身
5 篇「揭真相」工作精读:Yuan'26 Diagnosing Retrieval vs Utilization、本模块作者论文 Cache Hits Don't Save、Anatomy of Agentic Memory、Diagnosing RAG Hallucinations、Memory Forgetting Empirical Study;这些论文不发明新系统,但用严格实证挑战 G3 的主流叙事
Agent Memory 与 3 个相邻方向的交叉精读:Memory × RL(D-MEM、RMM、其他奖励驱动 trigger)、Memory × Multi-Agent(G-Memory、Collaborative Memory、Hindsight)、Memory × Multi-Modal(视觉记忆、空间记忆);每方向 2-3 篇代表论文 + 与 mainstream 的差异分析
3 周 / 8 周 / 12 周三档阅读路线 detailed 周计划;reading group 12 人 lab 实操;从 reading 到 reproducing 到 writing 三阶段过渡;如何用本路线 + 模块五 + 模块十九 拼出一篇 ARR / EMNLP 投稿