跳到主要内容
Agent Memory 分离式协同

第7章:与项目第一/二模块的对照分析

把鲲鹏 2026 三件套放在我们项目(长记忆分离式存储)第一/二模块(LMObject 统一抽象 + 分离式资源池化)的坐标系里——画清楚直接互补、重叠、可差异化创新的工程腹地,给项目设计提供精准的对照参照

鲲鹏 LMObject 分离式资源池化 项目对照 差异化 工程腹地

Ch4-6 把鲲鹏 2026 公开方案的三件套(上下文缓存 + 全局向量检索 + 超低内存混合介质)拆得很细——但作为项目研究者,更值得回答的问题是:这条路线和我们项目(长记忆分离式存储)的第一、第二模块(LMObject 统一抽象 + 分离式资源池化)是什么关系?这一章把鲲鹏路线和我们项目的工程坐标系放在同一张图上对齐——指出互补的部分(鲲鹏给了具体落地实例,我们提供更通用抽象)、重叠的部分(哪些设计选择在两条路线上都成立)、可差异化创新的部分(鲲鹏没覆盖、我们项目可以做出原创性的腹地)。

📑 目录


1. 项目第一/二模块的工程定位

1.1 项目主线:面向长记忆大模型系统的低成本高可靠分离式资源管理

我们的项目分三个研究模块:

  • 第一模块(我负责):多类型异构数据的统一抽象 + 跨层级管理 → LMObject 统一抽象
  • 第二模块(师兄负责):分离式资源池化 + 索引访问 + 存算调度
  • 第三模块(学弟负责):业务侧应用集成

为对接鲲鹏路线,我们重点关注第一模块和第二模块

1.2 第一模块的核心抽象:LMObject

LMObject 是项目第一模块对”长记忆数据”的统一抽象:

LMObject
├─ identity:          全局唯一 ID + 类型标签
├─ content_ref:       指向实际数据的引用(多介质可寻)
├─ access_profile:    六维访问刻画
│   ├─ frequency:     访问频率
│   ├─ locality:      访问局部性(时间 / 空间)
│   ├─ working_set:   工作集大小
│   ├─ granularity:   单次访问粒度
│   ├─ io_amplification: IO 放大系数
│   └─ miss_cost:     不命中代价
├─ tier_policy:       跨层级放置策略(HBM/DRAM/RDMA/SSD)
└─ lifecycle:         生命周期 + 衰减规则

LMObject 有四个类型

  • KV(KV cache 段)
  • Vector(向量索引节点)
  • Blob(多模态原始数据)
  • Trace(中间推理状态)

🌟 LMObject 的核心价值:把”长记忆数据”从4 类各自的存储方案升级为统一抽象 + 类型化策略——业务侧不需要关心数据放在哪个介质,跨层级管理由统一框架接管。

1.3 第二模块的核心:分离式资源池化

第二模块把硬件层的”内存池 / SSD 池 / 通信 fabric”做成可被上层统一调用的资源池

  • 池化抽象:内存池、SSD 池、跨节点 fabric
  • 索引访问:池上的访问原语(get/put/migrate)
  • 存算调度:业务需求 → 资源决策的转换层

2. 鲲鹏 vs 项目:抽象层级的对照

把两条路线在抽象层级上画一张图:

                业务应用层(Agent / RAG / Codec)
   ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
                        语义抽象层
   ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
   
   鲲鹏:                              项目:
   - 上下文缓存系统                     - LMObject 统一抽象
   - 全局向量检索                        - access_profile 六维
   - 超低内存混合介质检索                - tier_policy 策略
   
   ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
                        资源池化层
   ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
   
   鲲鹏:                              项目(第二模块):
   - UB 共享内存池                       - 分离式资源池抽象
                                        - 通用 fabric 接入
                                        - 调度 / 迁移引擎
   ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
                        硬件层
   ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
   
   鲲鹏:UB(专用硬件 + 协议)         项目:RDMA / CXL / UB 多协议

关键对照鲲鹏给的是”具体硬件 + 三个具体应用场景”——它在工程实现上非常完整,但抽象边界是 UB。项目给的是”通用抽象 + 多协议适配”——它在工程实现上不一定完美匹配某个具体硬件,但抽象边界更宽。

3. 直接互补:鲲鹏是 LMObject 的优秀实例

3.1 三件套对应到 LMObject 的四个类型

把鲲鹏的三件套映射到 LMObject 的四类数据:

鲲鹏方案对应 LMObject 类型对应 access_profile
上下文缓存(中间数据 + KV cache)Trace + KV高频访问 + 跨节点共享 + 中等粒度
全局向量检索(HNSW 整图)Vector中频随机读 + 低粒度 + 工作集大
超低内存混合介质检索Vector(量化版本)+ Blob(原向量)粗排高频 + 精排回访原 Blob

3.2 access_profile 在三件套上的具体形态

让我们用 LMObject 的 access_profile 六维来刻画三件套:

维度上下文缓存全局检索超低内存检索
frequency高(每工具一次)中(每查询一次)高(粗排扫整库)
locality时间局部性强(同会话)弱(全库随机)弱(全库随机)
working_set中(百 KB 级)大(TB 级)中(GB 级量化)+ 大(TB 级原向量)
granularity中(KB-MB)小(每节点 1KB)极小(粗排 8B) + 中(精排 3KB)
io_amplification高(粗精双阶段)
miss_cost中(重新调工具)高(重新检索)

🌟 关键判断access_profile 这套六维框架完全能刻画鲲鹏三件套的访问规律——这反过来说明 LMObject 的抽象在覆盖度上是充分的。

3.3 tier_policy 在鲲鹏上的具体落实

LMObject 的 tier_policy 决定数据在 HBM/DRAM/RDMA pool/SSD 之间的放置。把鲲鹏三件套的实际放置画出来:

数据鲲鹏放在哪LMObject tier 含义
KV cache 热段DRAMtier 0(hot)
KV cache 跨节点共享段UB pooltier 1(warm)
工具调用中间结果UB pooltier 1(warm)
HNSW 图(全部)UB pooltier 1(warm)
量化后的紧凑索引UB pooltier 1(warm)
原始向量(全 100B)SSDtier 2(cold)
历史会话归档SSD / 对象存储tier 2/3(cold/archive)

这张表说明:鲲鹏三件套是 LMObject tier_policy 的一种具体实现策略——其中 UB pool 担任 tier 1 的角色。项目的 LMObject 框架能直接套用鲲鹏这套分层策略,但抽象层级更高——项目的 tier 1 可以是 UB pool,也可以是 RDMA / CXL 池。

4. 重叠:两条路线一致的设计选择

把两条路线共同同意的设计选择列出来——这些是任何”分离式 Agent Memory 系统”都必然会做的工程决策:

4.1 共识 1:把”中间档介质”视为一等公民

两条路线都把”RDMA / UB / CXL”这一档介质当作与 DRAM、SSD 同等重要的资源——而不是”DRAM 的临时替代”。这个共识来自介质曲线的客观特性。

4.2 共识 2:跨节点共享是 Agent Memory 的硬性需求

无论是鲲鹏的 UB 池,还是项目第二模块的分离式资源池,核心价值都来自”多节点访问同一份数据”。单机方案在 Agent 协作 / PD 解耦推理 / 长会话跨节点这三个场景下都不够。

4.3 共识 3:访问模式刻画必须显式化

两条路线都强调”对不同类型数据采用不同放置策略”——鲲鹏路线 1/2/3 各自针对不同访问模式设计;项目的 access_profile 六维直接把这件事抽象化。这是分层管理的基础。

4.4 共识 4:量化是”超低成本通道”的必要技术

两条路线都把 RabitQ + PCA 这类量化技术放在重要位置:鲲鹏路线 3 直接整合,项目则可以把量化作为 LMObject 的一种 tier 表示(Vector_quantized → tier 1, Vector_full → tier 2)。

4.5 共识 5:二阶段精排是召回-成本曲线的关键

两条路线都接受”粗排 + 精排”的二阶段架构:鲲鹏路线 3 是显式两阶段;项目的 LMObject 可以把”粗排索引 + 精排原向量”建模为同一 Vector 对象的两个 tier 版本。

🌟 关键观察这五条共识把”什么是分离式 Agent Memory 系统”的设计骨架定义得相当清楚——任何项目要进入这个领域,都不能脱离这五条。

5. 差异化创新:项目能在鲲鹏之上做什么

鲲鹏路线很优秀,但仍有几处它没充分覆盖——这些是项目能做出原创性贡献的工程腹地。

5.1 创新点 1:跨硬件协议的统一抽象

鲲鹏方案的边界是 UB——它假设你能用上 UB 硬件。但 RDMA / CXL / 各厂商专用 fabric 现实并存,且 UB 仍然是华为生态。

项目的差异化:LMObject + 分离式资源池抽象不绑定具体硬件——同一套上层语义(LMObject + access_profile + tier_policy)可以底层接 UB / RDMA / CXL / 任意 fabric。

🌟 工程红利:这让 LMObject 框架的复用性显著高于鲲鹏方案——同一套软件可以在不同硬件栈上跑,迁移成本降一个数量级。

5.2 创新点 2:四类数据的全栈统一

鲲鹏路线 1 处理 Trace + KV,路线 2/3 处理 Vector,Blob(多模态原始数据)这一类没有专门设计

项目的差异化:LMObject 显式覆盖 KV / Vector / Blob / Trace 四类,每一类都有独立的 access_profile 和 tier_policy。这不是”多写两个类”——是把”长记忆系统的全数据画像”做完整。

具体到工程:

  • Trace 和 Vector 之间存在关联检索需求(“找出和这个 trace 相关的 vector 知识”)
  • Blob 和 Vector 之间需要协同存储(多模态嵌入和原始图像 / 视频不能脱节)
  • KV 和 Trace 之间需要生命周期同步(推理结束 → 这两类数据一起决策保留 / 丢弃)

这些跨类型协同只在统一抽象框架里才好做——这是 LMObject 框架对鲲鹏方案的扩展空间。

5.3 创新点 3:自适应迁移与冷热演化

鲲鹏的三件套各自实现,没有公共的”自适应迁移”机制——每个子系统的数据放在哪是设计期决定的,运行期不会动。

项目的差异化:LMObject + tier_policy 显式支持运行期的 自适应迁移

  • 监控每个 LMObject 的实际访问模式(access_profile 实测)
  • 当实测和设计偏差大时,自动把对象迁移到更合适的 tier
  • 跨层级迁移由项目第二模块的池化引擎承担

这是模块十四《长记忆大模型系统》第 10 章详细展开的方向——也是鲲鹏路线还没做透的工程腹地。

5.4 创新点 4:性能-成本协同建模与决策

鲲鹏给了三种工程哲学(路线 2 偏召回 / 路线 3 偏成本),但没有把”什么时候选哪条”的决策做成系统级机制——它由人工架构师决定。

项目的差异化:基于 LMObject + access_profile + tier_policy,可以做自动化的性能-成本建模

  • 对每个 LMObject,预测它在不同 tier 下的延迟和成本
  • 根据业务 SLA(P99、年度预算)自动选择最优 tier 组合
  • 把”路线 2 vs 路线 3”这种选择自动化 + 可观测

模块十四第 11 章详细展开了这套建模——它是项目能在鲲鹏路线之上做的**“上层智能”**。

5.5 创新点 5:跨域 / 跨业务的标准化接入

鲲鹏方案是端到端——它假设你用 OpenClaw / OpenViking / 鲲鹏硬件全栈。但实际生产里大部分公司有混合栈。

项目的差异化:LMObject 给出的是协议级标准——只要业务侧实现了 access_profile 接口,就能接入项目的资源池化层。这种标准化让项目天然支持多厂商混合部署

6. 第二模块(师兄方向)的对照点

第二模块的核心是分离式资源池化 + 索引访问 + 存算调度——它和鲲鹏路线的对照点:

6.1 池化抽象的对照

维度鲲鹏 UB 池项目第二模块
协议层UB 专用多协议(UB / RDMA / CXL)
池化粒度节点级合池任意拓扑(树状 / 网状 / 多层)
元数据内置(region 表)标准化协议(可被外部观测)
故障域UB 故障域内跨故障域(带容灾)

6.2 索引访问原语的对照

鲲鹏池上提供 load/store + 简单 GC + 引用计数。项目第二模块可以把这层做成更丰富的原语:

  • get(lmobj_id) → bytes(带 tier 提示)
  • put(lmobj_id, bytes, tier_hint)
  • migrate(lmobj_id, from_tier, to_tier)(跨层级迁移)
  • lock(lmobj_id, mode)(多读单写 / 排他锁)
  • subscribe(lmobj_id, callback)(变更通知)

这些更丰富的原语支持自适应迁移、跨节点同步、生命周期管理等更复杂的工作负载——这是项目第二模块对鲲鹏 UB 池的工程扩展。

6.3 存算调度的对照

鲲鹏方案在调度上偏静态——数据放在哪由设计期决定。项目第二模块把存算调度做成动态决策引擎

  • 业务需求 → 解析为 LMObject 集合 + access_profile
  • 资源池可用性 → 给定 budget 下的 tier 组合空间
  • 优化器 → 找出”满足 SLA 且最小成本”的组合
  • 反馈环 → 根据实测调整未来决策

这套调度引擎是项目第二模块的核心创新点——也是鲲鹏路线还没做的事。

7. 整合视图:项目可作为方法论 + 实例验证

7.1 一个清晰的关系定位

把项目和鲲鹏路线的关系用一句话总结:

鲲鹏 2026 公开方案是 LMObject 框架的一个具体优秀实例;项目第一/二模块在鲲鹏之上做出”通用抽象 + 多协议适配 + 自适应迁移 + 自动化决策”的方法论扩展。

7.2 项目论文 / 方案的叙事策略

基于这层关系,项目的研究论文 / 申报书可以这样组织叙事:

  • 现状(背景):分离式 Agent Memory 是公认的关键方向;鲲鹏 2026 给出了一个完整工程落地实例,证明了价值
  • 挑战(gap):鲲鹏方案是专用硬件 + 单一访问模式——业界缺一套通用、跨硬件、自适应的框架
  • 方法(贡献):项目第一/二模块的 LMObject + access_profile + tier_policy + 自适应迁移 + 决策引擎,把鲲鹏的工程贡献抽象化、通用化
  • 验证:用 LMObject 框架去复现鲲鹏三件套——证明框架覆盖度;同时在 RDMA / CXL 等其他硬件上跑同一套抽象——证明跨协议有效性

🌟 关键叙事点:项目不是”和鲲鹏竞争”——是”在鲲鹏证明的工程价值上做方法论提升”。这种关系既让评委容易理解(鲲鹏证明了方向),也让项目原创性清晰(抽象 + 通用 + 自适应是鲲鹏没做的)。

7.3 实施层面的对接路径

具体到工程实施,可以这样切入:

阶段 1(短期):用项目 LMObject 框架描述鲲鹏三件套——这是对照建模

  • 每个鲲鹏子系统对应一个 access_profile + tier_policy 组合
  • 在 LMObject API 上复现鲲鹏功能
  • 这个阶段不需要新硬件——可以在 RDMA 集群上 emulate

阶段 2(中期):在 LMObject 上加自适应迁移引擎——这是方法论扩展

  • 监控实际访问模式 → 反馈到 tier_policy
  • 实现跨层级迁移协议
  • 与第二模块的池化抽象对接

阶段 3(长期):在多硬件栈上部署同一份 LMObject 框架——这是通用性验证

  • RDMA 集群(已有)
  • CXL 集群(如果硬件可获得)
  • 鲲鹏 UB(如果合作)
  • 比较同一应用在不同硬件栈上的性能 / 成本曲线

🎯 自我检验清单

  • 项目第一模块的 LMObject 抽象有哪四个类型?六维 access_profile 各自含义是什么?
  • 鲲鹏三件套(上下文缓存 / 全局检索 / 超低内存检索)分别对应 LMObject 的哪些类型?
  • 列出两条路线的 5 条共识——哪一条让你觉得”无论哪个团队来做都会同意”?
  • 项目能在鲲鹏路线之上做的 5 个差异化创新点是哪些?哪一个对你的研究最有吸引力?
  • 项目论文的”叙事策略”是什么?如何让评委同时看到鲲鹏的工程价值和项目的方法论贡献?

📚 参考资料

  • 鲲鹏 Agent Memory 创新方案(华为鲲鹏团队 2026 公开发表)
  • 本系列模块十四 长记忆大模型系统(项目第一模块详细方法论)
    • 第 1 章:长记忆为什么是大模型的关键基础
    • 第 2 章:多类型数据的访问规律建模(access_profile 六维)
    • 第 8 章:统一表示与跨层资源映射机理(LMObject 抽象)
    • 第 9-10 章:分层放置策略 + 自适应迁移
    • 第 11 章:性能成本协同优化建模
  • 本系列模块十三 新型互联与远程内存(硬件协议基础)
  • 本系列模块十六 Ch4-6:鲲鹏三件套详解

下一章预告:Ch8 是整模块的总章——给出端到端实战参考:OpenClaw + OpenViking + 鲲鹏端到端集成的拼装路径,以及怎么在没有 UB 硬件的条件下用 RDMA 集群做”等价复现”以验证项目第一模块的 LMObject 抽象。