跳到主要内容
⚙️ Agent Runtime 9 篇文章 · 9 个章节

模块六:Agent Runtime

系统讲解 Agent 怎么稳定、可恢复、可组合地跑起来:控制流模型、多 Agent 编排、主流 Runtime 框架、Durable Execution、Agent Transactions(SagaLLM)、MCP/A2A 协议、Observability,以及一套生产级订单 Agent 端到端实战。

开始学习

章节目录

从 5 行 demo 到生产级 agent 的鸿沟,Runtime 的 4 大职责,Agent Stack 全景图,以及生产 agent 的 8 类失败模式
5 种主流 agent 控制流模型详解:ReAct 循环、Plan-and-Execute、Reflexion 自反思、DAG/State Machine、Tool-as-Thought,各自适用场景和代码骨架
5 种主流多 agent 编排模式详解,适用场景对照,LangGraph Supervisor/Swarm 官方实现剖析,以及混合模式
LangGraph / CrewAI / AutoGen / OpenAI Agents SDK / Pydantic AI / Mastra / Agno / Letta 八大框架的设计哲学、能力矩阵、最简代码与选型决策
Checkpoint / Replay / Resume 的原理,LangGraph 内置 checkpointer 详解,Temporal × Agent 的工业级范式,Restate / Cloudflare Agents 等替代方案
为什么 agent 需要事务,Saga / 2PC / Outbox / Event Sourcing 四种模式对比,SagaLLM 论文精读,LangGraph + Temporal 的工程实现
Model Context Protocol(MCP)与 Agent-to-Agent(A2A)协议详解,架构、最简代码、安全模型、协同使用场景
OpenTelemetry GenAI Semantic Conventions 详解,LangSmith / Langfuse 等 LLM 观测平台对比,自建 OTel pipeline,关键指标与告警
完整可跑的订单处理 agent:LangGraph 编排 + Temporal durable + MCP 工具 + Saga 补偿 + Mem0 长期记忆 + LangSmith/OTel 全链路观测 + 故障注入测试

学习建议

前置要求

Agent Memory 模块 + 分布式系统基础(事务、消息队列、可靠性)

  • Agent Memory(模块五)讲"知道什么",本模块讲"怎么做",建议先完成模块五
  • 第 5、6 章是核心:Durable Execution + Saga 决定 Agent 能否撑住生产
  • 端到端实战覆盖 LangGraph + Temporal + MCP + LangSmith 全栈,建议按 docker-compose 跑通