🧩 自适应运行时物理设计 · MorphoSys → AURA 9 篇文章 · 9 个章节
自适应运行时物理设计 · MorphoSys → AURA
自适应运行时物理设计 · MorphoSys → AURA相关技术文档
开始学习章节目录
v25 (adaptive lock placement) → v27 (5 维度 runtime physical design) 的演进、5 个自适应维度的诚实分级、boundary statement 的来历、3 个 contribution 的可复述版本
读 v27 paper 前的 30 分钟预备包:ConnectX 代际 atomic IOPS 上限、OCC 三阶段、CREST (MN-only) vs LOTUS (CN-only) 三行 motivation 表、bottleneck 在 CN scale-out / phase / mode 三个维度上的漂移路径
AURA v27 的 5 个自适应维度(执行位置、仲裁位置、仲裁粒度、MN 主权、Mode/fallback)逐维拆解、每维的 v27 状态、所对应的代码 anchor、与 LOTUS-3MN 的 MN-primary 对照
AURA v27 Benefit 函数 (atomic·S − rpc·C_rpc − move·C_move − load·C_load) 的推导、A1.a 规则式 tuner(三信号 × 5%/tick × 滞回带)、A1.b SGD tuner((B_pred − k·r)² loss + EMA-tuned k + 5%/step 上限)、SGD 权重在 drift workload 下的演化证据
A2 affinity binding(cohort union-find + min_edge=5.0 + max_cluster=3)、A3 cohort split(contention_score = Σ W² / |c| 阈值切分)、A4 future-cost reservoir(256-sample 滑动窗 + predicted_local_ratio)的工程化细节,配合 drift workload 下 migrations 0→21/tick、splits 11→64 的数据 walk-through
AURA v27 怎么保证在线搬锁不破坏快照隔离:freeze-drain-handoff-publish 四阶段时序、W14.5 dual-authority 守卫、I1(at-most-one authority)+ I2(read set 与 commit ts 一致)+ I3(epoch handoff 排空 in-flight txn)三个不变式的证明草图与反例破坏
把 v27 两个最大的工程负结果完整摊开:W11 REMOTE_OWNER takeover 的 99.5% abort cascade 根因(cv.wait_for(5s) × worker pool 16 槽死锁)、W11.2/3/4/5 四次修复尝试时间线、RDMA dispatch 6 步实现到 mlx5 first SEND REMOTE_INVAL_REQ_ERR 的完整还原、何时该 punt 的工程判断框架
AURA v27 §6 evaluation 的方法论拆解:5-cell leave-one-out ablation 与 16-cell full ablation 的取舍、drift workload (drift_period_ms) 怎么设计才公平、rep 3 取中位数 / bootstrap CI / SSH-truncation Drift::Stop 修复等工程教训、当前已有数据与 §6.4 LOTUS reference + §6.6 12-CN sweep 的缺口清单
从 0 到 KOPS 跑通 AURA v27 §6 所有正向数据的端到端实战:CloudLab 5-node 集群 setup(OFED 4.9 + IOMMU passthrough + mlx5_2 校验)、3 条 smoke 脚本(5-cell / a1b / drift)的运行方式、日志到 paper §6 表格的 cookbook、故障速查表