⚙️ Agent Runtime 9 篇文章 · 9 个章节

模块六：Agent Runtime

系统讲解 Agent 怎么稳定、可恢复、可组合地跑起来：控制流模型、多 Agent 编排、主流 Runtime 框架、Durable Execution、Agent Transactions（SagaLLM）、MCP/A2A 协议、Observability，以及一套生产级订单 Agent 端到端实战。

开始学习

章节目录

1 第1章：Agent Runtime 是什么

从 5 行 demo 到生产级 agent 的鸿沟,Runtime 的 4 大职责,Agent Stack 全景图,以及生产 agent 的 8 类失败模式

2 第2章：Agent 控制流模型 —— ReAct / Plan-Execute / Reflexion / Graph

5 种主流 agent 控制流模型详解:ReAct 循环、Plan-and-Execute、Reflexion 自反思、DAG/State Machine、Tool-as-Thought,各自适用场景和代码骨架

3 第3章：多 Agent 编排模式 —— Supervisor / Swarm / Hierarchical / Mesh / Pipeline

5 种主流多 agent 编排模式详解,适用场景对照,LangGraph Supervisor/Swarm 官方实现剖析,以及混合模式

4 第4章：主流 Runtime 框架对比

LangGraph / CrewAI / AutoGen / OpenAI Agents SDK / Pydantic AI / Mastra / Agno / Letta 八大框架的设计哲学、能力矩阵、最简代码与选型决策

5 第5章：Durable Execution —— 让 Agent 在崩溃中存活

Checkpoint / Replay / Resume 的原理,LangGraph 内置 checkpointer 详解,Temporal × Agent 的工业级范式,Restate / Cloudflare Agents 等替代方案

6 第6章：Agent Transactions —— Saga / 2PC / Outbox / SagaLLM

为什么 agent 需要事务,Saga / 2PC / Outbox / Event Sourcing 四种模式对比,SagaLLM 论文精读,LangGraph + Temporal 的工程实现

7 第7章：协议层 —— MCP(Agent ↔ Tool)与 A2A(Agent ↔ Agent)

Model Context Protocol(MCP)与 Agent-to-Agent(A2A)协议详解,架构、最简代码、安全模型、协同使用场景

8 第8章：Agent Observability —— OTel GenAI / LangSmith / Langfuse

OpenTelemetry GenAI Semantic Conventions 详解,LangSmith / Langfuse 等 LLM 观测平台对比,自建 OTel pipeline,关键指标与告警

9 第9章：端到端实战 —— 生产级订单 Agent

完整可跑的订单处理 agent:LangGraph 编排 + Temporal durable + MCP 工具 + Saga 补偿 + Mem0 长期记忆 + LangSmith/OTel 全链路观测 + 故障注入测试

学习建议

前置要求

Agent Memory 模块 + 分布式系统基础（事务、消息队列、可靠性）

Agent Memory（模块五）讲"知道什么"，本模块讲"怎么做"，建议先完成模块五
第 5、6 章是核心：Durable Execution + Saga 决定 Agent 能否撑住生产
端到端实战覆盖 LangGraph + Temporal + MCP + LangSmith 全栈，建议按 docker-compose 跑通

模块六：Agent Runtime

章节目录

学习建议

前置要求

搜索