人工智能实践(语言智能)
第7讲:Agent

第7讲:Agent

从经典 Agent 架构过渡到 LLM 驱动的自主系统,掌握 ReAct、规划、记忆、工具与多 Agent 协作,完成端到端 Agent 实验

导语:从经典 Agent 到 LLM Agent

"智能体"(agent)——通过传感器感知环境、通过执行器作用于环境的自主实体——并非大语言模型时代的新概念。早在 1970 年代,SRI 的 SHAKEY 机器人就已经把感知、规划与行动集成在一起;1980 年代 Rodney Brooks 用包容式架构(subsumption architecture)证明"无需中心表征也能产生智能行为";1990 年代 Rao 与 Georgeff 的 BDI(Belief-Desire-Intention)模型把哲学中的实践推理形式化为可实现的多智能体系统。Russell 与 Norvig 的 AIMA 把智能体分为"简单反射 → 基于模型 → 目标驱动 → 效用驱动 → 学习型"五类,这套词汇表至今仍是我们讨论 agent 设计的基准。

2022 年之后,大语言模型把这一领域的范式彻底改写:手工编码规则被涌现推理取代,结构化 API 被自然语言工具调用取代,固定动作空间被可执行代码取代。ReAct、Toolformer、AutoGPT、Voyager 等工作在短短两年内把 agent 从"实验室 demo"推到"GitHub 18 万星的开源项目"。但经典架构的思想——BDI 的信念与意图、分层架构的抽象层、黑板的共享工作区——并未失效,反而在 LLM Agent 中以新的形态复活:prompt 就是信念,规划就是意图,memory 就是黑板。本讲的核心任务,就是帮你把这两条线索打通。

学习目标

完成本讲后,你将能够:

  1. 回顾 经典 Agent 架构(反应式 / 审慎式 / BDI / 分层 / 黑板),说出它们在 LLM Agent 时代的映射
  2. 理解 LLM 作为 Agent 大脑的四大要素:规划(Planning)、记忆(Memory)、工具(Tools)、反思(Reflection)
  3. 掌握 ReAct 范式:Reason + Act 交替循环,以及它与 Plan-and-Solve、ReWOO、LATS 的关系
  4. 配置 Function Calling 与 MCP(Model Context Protocol),理解"AI 的 USB-C"解决的 M×N 集成问题
  5. 比较 AutoGen / CrewAI / LangGraph 等多 Agent 框架,判断何时不该用多 Agent
  6. 独立交付 一个带搜索、计算器、文件读写的小型 Agent,并在真实任务上评测

学时分配

环节时长内容
讲授~90 分钟经典架构 / LLM Agent / 规划 / 记忆工具 / 多 Agent
上机实验~90 分钟用 smolagents 或 LangGraph 构建工具增强 Agent

课程内容

关键词

Agent · ReAct · BDI · Planning · Memory · Tool Use · Function Calling · MCP · Reflexion · Tree of Thoughts · AutoGen · CrewAI · LangGraph · smolagents