新时代实验室 · AI 原生个人站

AI Native Lab

新时代实验室——一个 AI 系统工程师的 AI 原生知识中心

教程 · 项目档案 · 比赛复盘 · 论文研读 · 思考——五类内容互相反向引用，让"做完就忘"变成"做完就沉淀"。Built by Chaomei · 低层系统 + 大规模 AI · USTC

浏览项目档案 GitHub

📚

学习

教程与方法论

从 CUDA 算子到 Agent 工程，从论文研读到方法论提炼——结构化的学习路径与教程。

27 个模块 · 254+ 章

🛠️

实战

项目 · 比赛 · 研究笔记

工作 / 个人 / 开源项目复盘 + 比赛档案 + 论文笔记——按统一模板长期沉淀的实战知识。

1 个项目 · 0 场比赛 · 11 份笔记

💭

思考

博客与零散思考

AI Infra / Agent / 工程方法论上的散文与短篇——长文不一定每天都写，思考可以随时记录。

3+ 篇博客

👤

关于

关于站点 · 联系方式

作者介绍、站点定位、面试题集 + 高频考点——以及怎么联系。

面试 · 关于 · 外链

学习 / 全部教程模块

教程知识库

19 个模块覆盖 AI Infra 全栈核心 + Agent 系统进阶

AIInfra学习路线 AIInfra学习路线

系统化的 AI Infra 学习路径与知识图谱

17 篇文章探索

AIInfra前置基础 AIInfra前置基础

GPU 架构、计算机体系结构等核心前置知识

20 篇文章探索

CUDA编程与算子优化 CUDA编程与算子优化

CUDA 编程模型、算子开发与性能优化

9 篇文章探索

分布式训练分布式训练

数据并行、模型并行与大规模分布式训练

8 篇文章探索

推理优化推理优化

模型压缩、量化加速与推理引擎优化

9 篇文章探索

Agent Memory Agent Memory

Agent 长期记忆：分类法、论文、框架、评测、端到端实战

9 篇文章探索

Agent Runtime Agent Runtime

Agent 怎么稳定跑起来：控制流、编排、Durable、事务、协议、observability

9 篇文章探索

Agentic RL Agentic RL

Agent 怎么自我改进：PG/PPO/GRPO、RLVR、Tool RL、Multi-turn Async、训练框架、Search Agent 实战

9 篇文章探索

Agent Eval Agent Eval

Agent 怎么客观评测：多维度框架、5 大 benchmark、LLM-as-Judge、Reward Hacking 防御、CI/CD

9 篇文章探索

Computer Use Computer Use

Agent 操作真实软件：视觉 Grounding/VLA、三大商业 API、browser-use/Stagehand 开源框架、OSWorld 评测、电商实战

9 篇文章探索

Code Agents Code Agents

Code Agent 实战栈：Cursor/Devin/Claude Code 商业产品、OpenHands/Aider 开源框架、SWE-Agent + ACI 论文、SWE-bench 评测、IDE/LSP 集成、训练与生产

10 篇文章探索

Multi-Modal Multi-Modal

多模态 Agent：VLM(Qwen2.5-VL/InternVL/GPT-4o/Gemini)、视频音频 agent(Whisper/Realtime API)、MMMU 等评测、企业多模态助手实战

6 篇文章探索

Agent Safety Agent Safety

Agent 安全工程：三层威胁、Jailbreak 攻防(GCG/PAIR/TAP)、Constitutional AI、Anthropic RSP / OpenAI Preparedness、garak 红队、端到端 red team 实战

6 篇文章探索

新型互联与远程内存新型互联与远程内存

新型互联与远程内存：RDMA verbs、CXL、分离式内存事务系统、训练侧参数池化、端到端 RDMA 集群实战

8 篇文章探索

长记忆大模型系统长记忆大模型系统

长记忆大模型系统：四类长记忆数据画像、HBM/DRAM/SSD 跨层级管理、统一表示、分层放置、自适应迁移、性能-成本协同

12 篇文章探索

分离式事务的动态锁所有权分离式事务的动态锁所有权

分离式事务的动态锁所有权 (AURA)：分布式事务在分离式架构上的锁迁移、所有权管理、容错

14 篇文章探索

Agent Memory 分离式协同 Agent Memory 分离式协同

Agent Memory 与向量检索的分离式内存协同：上下文缓存 / 全局向量检索 / 超低内存量化检索 / 鲲鹏路线复盘 / 项目对照

8 篇文章探索

Agent Harness 工程 Agent Harness 工程

Agent Harness 工程方法论：信噪比管理、上下文工程六维度、Claude Code 实战机制、跨模型设计原则、业务/Harness/平台三层心智模型

2 篇文章探索

空间记忆与具身智能基础空间记忆与具身智能基础

空间记忆与具身智能基础：Chat Memory ≠ Spatial Memory、感知/认知/记忆三层架构、世界模型 M 层、神经符号路线、跨会话状态维护与可校准评测

9 篇文章探索

Agent Memory 实证审计与负结果方法论 Agent Memory 实证审计与负结果方法论

Agent Memory 实证审计与负结果方法论：把 11 个 SOTA Memory 拆成 2 轴分类法、trigger primitive 拆成可证伪假设、评测三件套（预注册 + 配对 + positive control）

9 篇文章探索

AI 系统性能工程方法论 AI 系统性能工程方法论

AI 系统性能工程方法论：Goodput、Mechanical Sympathy、NVL72 全景、跨层调优、案例研究、Ultra-Scale 趋势、175+ 项 Cheat Sheet

12 篇文章探索

分离式内存事务系统全景调研分离式内存事务系统全景调研

分离式内存事务系统全景调研：DM 事务的定义边界、技术分支、性能/正确性权衡、与 LMObject 的对照

9 篇文章探索

多 Agent 并发与事务多 Agent 并发与事务

多 Agent 并发与事务：多 Agent 共享状态下的并发控制、隔离级别、事务边界与冲突解决

4 篇文章探索

Agent Memory ANN 系统 Agent Memory ANN 系统

Agent Memory ANN 系统：从 HNSW / DiskANN / SPANN / RabitQ 到 Agent 场景下的工程化整合

9 篇文章探索

Agent Memory 论文演进与综述精读 Agent Memory 论文演进与综述精读

Agent Memory 论文演进与综述精读：三年演进、11 系统 atlas、综述 cross-reading

10 篇文章探索

AURA 论文精讲 AURA 论文精讲

AURA 论文精讲：分离式事务动态锁所有权的逐节拆解 + 复现要点

9 篇文章探索

自适应运行时物理设计 · MorphoSys → AURA 自适应运行时物理设计 · MorphoSys → AURA

自适应运行时物理设计：从 MorphoSys 到 AURA 的工程演进、状态机建模、决策回路

9 篇文章探索

实战 / 最近的项目

项目档案

查看全部 →

open-source 2025-Q4 ~ 持续中

AIInfraGuide — 个人 AI 知识中心站点

把 AI Infra / Agent / 项目复盘 / 论文笔记 / 思考整合到一个 Astro 静态站点；19+ 模块、500+ 页，部署在阿里云 ECS

思考 / 博客

AI Native Lab

学习

实战

思考

关于

教程知识库

AIInfra学习路线 AIInfra学习路线

AIInfra前置基础 AIInfra前置基础

CUDA编程与算子优化 CUDA编程与算子优化

分布式训练分布式训练

推理优化推理优化

Agent Memory Agent Memory

Agent Runtime Agent Runtime

Agentic RL Agentic RL

Agent Eval Agent Eval

Computer Use Computer Use

Code Agents Code Agents

Multi-Modal Multi-Modal

Agent Safety Agent Safety

新型互联与远程内存新型互联与远程内存

长记忆大模型系统长记忆大模型系统

分离式事务的动态锁所有权分离式事务的动态锁所有权

Agent Memory 分离式协同 Agent Memory 分离式协同

Agent Harness 工程 Agent Harness 工程

空间记忆与具身智能基础空间记忆与具身智能基础

Agent Memory 实证审计与负结果方法论 Agent Memory 实证审计与负结果方法论

AI 系统性能工程方法论 AI 系统性能工程方法论

分离式内存事务系统全景调研分离式内存事务系统全景调研

多 Agent 并发与事务多 Agent 并发与事务

Agent Memory ANN 系统 Agent Memory ANN 系统

Agent Memory 论文演进与综述精读 Agent Memory 论文演进与综述精读

AURA 论文精讲 AURA 论文精讲

自适应运行时物理设计 · MorphoSys → AURA 自适应运行时物理设计 · MorphoSys → AURA

项目档案

AIInfraGuide — 个人 AI 知识中心站点

最新文章

关于作者 Chaomei

AIInfraGuide 文章更新日志

欢迎来到 AIInfraGuide

AI Native Lab

学习

实战

思考

关于

教程知识库

AIInfra学习路线 AIInfra学习路线

AIInfra前置基础 AIInfra前置基础

CUDA编程与算子优化 CUDA编程与算子优化

分布式训练 分布式训练

推理优化 推理优化

Agent Memory Agent Memory

Agent Runtime Agent Runtime

Agentic RL Agentic RL

Agent Eval Agent Eval

Computer Use Computer Use

Code Agents Code Agents

Multi-Modal Multi-Modal

Agent Safety Agent Safety

新型互联与远程内存 新型互联与远程内存

长记忆大模型系统 长记忆大模型系统

分离式事务的动态锁所有权 分离式事务的动态锁所有权

Agent Memory 分离式协同 Agent Memory 分离式协同

Agent Harness 工程 Agent Harness 工程

空间记忆与具身智能基础 空间记忆与具身智能基础

Agent Memory 实证审计与负结果方法论 Agent Memory 实证审计与负结果方法论

AI 系统性能工程方法论 AI 系统性能工程方法论

分离式内存事务系统全景调研 分离式内存事务系统全景调研

多 Agent 并发与事务 多 Agent 并发与事务

Agent Memory ANN 系统 Agent Memory ANN 系统

Agent Memory 论文演进与综述精读 Agent Memory 论文演进与综述精读

AURA 论文精讲 AURA 论文精讲

自适应运行时物理设计 · MorphoSys → AURA 自适应运行时物理设计 · MorphoSys → AURA

项目档案

AIInfraGuide — 个人 AI 知识中心站点

最新文章

关于作者 Chaomei

AIInfraGuide 文章更新日志

欢迎来到 AIInfraGuide

搜索

分布式训练分布式训练

推理优化推理优化

新型互联与远程内存新型互联与远程内存

长记忆大模型系统长记忆大模型系统

分离式事务的动态锁所有权分离式事务的动态锁所有权

空间记忆与具身智能基础空间记忆与具身智能基础

分离式内存事务系统全景调研分离式内存事务系统全景调研

多 Agent 并发与事务多 Agent 并发与事务