第7讲:Agent
从经典 Agent 架构过渡到 LLM 驱动的自主系统,掌握 ReAct、规划、记忆、工具与多 Agent 协作,完成端到端 Agent 实验
导语:从经典 Agent 到 LLM Agent
"智能体"(agent)——通过传感器感知环境、通过执行器作用于环境的自主实体——并非大语言模型时代的新概念。早在 1970 年代,SRI 的 SHAKEY 机器人就已经把感知、规划与行动集成在一起;1980 年代 Rodney Brooks 用包容式架构(subsumption architecture)证明"无需中心表征也能产生智能行为";1990 年代 Rao 与 Georgeff 的 BDI(Belief-Desire-Intention)模型把哲学中的实践推理形式化为可实现的多智能体系统。Russell 与 Norvig 的 AIMA 把智能体分为"简单反射 → 基于模型 → 目标驱动 → 效用驱动 → 学习型"五类,这套词汇表至今仍是我们讨论 agent 设计的基准。
2022 年之后,大语言模型把这一领域的范式彻底改写:手工编码规则被涌现推理取代,结构化 API 被自然语言工具调用取代,固定动作空间被可执行代码取代。ReAct、Toolformer、AutoGPT、Voyager 等工作在短短两年内把 agent 从"实验室 demo"推到"GitHub 18 万星的开源项目"。但经典架构的思想——BDI 的信念与意图、分层架构的抽象层、黑板的共享工作区——并未失效,反而在 LLM Agent 中以新的形态复活:prompt 就是信念,规划就是意图,memory 就是黑板。本讲的核心任务,就是帮你把这两条线索打通。
学习目标
完成本讲后,你将能够:
- 回顾 经典 Agent 架构(反应式 / 审慎式 / BDI / 分层 / 黑板),说出它们在 LLM Agent 时代的映射
- 理解 LLM 作为 Agent 大脑的四大要素:规划(Planning)、记忆(Memory)、工具(Tools)、反思(Reflection)
- 掌握 ReAct 范式:Reason + Act 交替循环,以及它与 Plan-and-Solve、ReWOO、LATS 的关系
- 配置 Function Calling 与 MCP(Model Context Protocol),理解"AI 的 USB-C"解决的 M×N 集成问题
- 比较 AutoGen / CrewAI / LangGraph 等多 Agent 框架,判断何时不该用多 Agent
- 独立交付 一个带搜索、计算器、文件读写的小型 Agent,并在真实任务上评测
学时分配
| 环节 | 时长 | 内容 |
|---|---|---|
| 讲授 | ~90 分钟 | 经典架构 / LLM Agent / 规划 / 记忆工具 / 多 Agent |
| 上机实验 | ~90 分钟 | 用 smolagents 或 LangGraph 构建工具增强 Agent |
课程内容
7.1 经典 Agent 架构
Reactive / Deliberative / BDI / 分层 / 黑板架构,以及它们今天仍然管用的部分
7.2 LLM Agent 的四要素
规划 / 记忆 / 工具 / 反思;ReAct 范式;与经典架构的一一映射
7.3 规划与推理
CoT / Plan-and-Solve / ReWOO;Tree of Thoughts 与 LATS;Reflexion 反思
7.4 记忆与工具
短期 vs 长期记忆;Function Calling;MCP 入门;工具选择策略
7.5 多 Agent 协作
AutoGen / CrewAI / LangGraph;debate、group chat、hierarchical;何时不用多 Agent
上机实验
用 smolagents 或 LangGraph 搭一个带搜索 + 计算器 + 文件读写的 Agent
参考文献
ReAct、Toolformer、AutoGen、Reflexion、MRKL、MCP、LangGraph 等
关键词
Agent · ReAct · BDI · Planning · Memory · Tool Use · Function Calling · MCP · Reflexion · Tree of Thoughts · AutoGen · CrewAI · LangGraph · smolagents