第7讲：Agent

从经典 Agent 架构过渡到 LLM 驱动的自主系统，掌握 ReAct、规划、记忆、工具与多 Agent 协作，完成端到端 Agent 实验

导语：从经典 Agent 到 LLM Agent

"智能体"（agent）——通过传感器感知环境、通过执行器作用于环境的自主实体——并非大语言模型时代的新概念。早在 1970 年代，SRI 的 SHAKEY 机器人就已经把感知、规划与行动集成在一起；1980 年代 Rodney Brooks 用包容式架构（subsumption architecture）证明"无需中心表征也能产生智能行为"；1990 年代 Rao 与 Georgeff 的 BDI（Belief-Desire-Intention）模型把哲学中的实践推理形式化为可实现的多智能体系统。Russell 与 Norvig 的 AIMA 把智能体分为"简单反射 → 基于模型 → 目标驱动 → 效用驱动 → 学习型"五类，这套词汇表至今仍是我们讨论 agent 设计的基准。

2022 年之后，大语言模型把这一领域的范式彻底改写：手工编码规则被涌现推理取代，结构化 API 被自然语言工具调用取代，固定动作空间被可执行代码取代。ReAct、Toolformer、AutoGPT、Voyager 等工作在短短两年内把 agent 从"实验室 demo"推到"GitHub 18 万星的开源项目"。但经典架构的思想——BDI 的信念与意图、分层架构的抽象层、黑板的共享工作区——并未失效，反而在 LLM Agent 中以新的形态复活：prompt 就是信念，规划就是意图，memory 就是黑板。本讲的核心任务，就是帮你把这两条线索打通。

学习目标

完成本讲后，你将能够：

回顾经典 Agent 架构（反应式 / 审慎式 / BDI / 分层 / 黑板），说出它们在 LLM Agent 时代的映射
理解 LLM 作为 Agent 大脑的四大要素：规划（Planning）、记忆（Memory）、工具（Tools）、反思（Reflection）
掌握 ReAct 范式：Reason + Act 交替循环，以及它与 Plan-and-Solve、ReWOO、LATS 的关系
配置 Function Calling 与 MCP（Model Context Protocol），理解"AI 的 USB-C"解决的 M×N 集成问题
比较 AutoGen / CrewAI / LangGraph 等多 Agent 框架，判断何时不该用多 Agent
独立交付 一个带搜索、计算器、文件读写的小型 Agent，并在真实任务上评测

学时分配

环节	时长	内容
讲授	~90 分钟	经典架构 / LLM Agent / 规划 / 记忆工具 / 多 Agent
上机实验	~90 分钟	用 smolagents 或 LangGraph 构建工具增强 Agent

导语：从经典 Agent 到 LLM Agent

学习目标

学时分配

课程内容

7.1 经典 Agent 架构

7.2 LLM Agent 的四要素

7.3 规划与推理

7.4 记忆与工具

7.5 多 Agent 协作

上机实验

参考文献

关键词

On this page