100天掌握大语言模型第十四周:LLM Agent Demo
June 11 @ 7:00 pm - 8:00 pm PDT

“在过去十二周中,我们逐步构建了越来越强大的大语言模型:我们训练模型、微调模型,通过RAG赋予模型知识,并利用提示工程提升其推理能力。而第14周,则是大语言模型从‘等待提问’走向‘主动行动’的重要转折点。”
从“回答问题”到“执行任务”的范式转变
到目前为止,我们所构建的所有大语言模型应用都具有一个共同特征:模型等待人类提出问题,生成答案,然后停止运行。接下来由人类阅读答案,并决定下一步该采取什么行动。
换句话说,模型本身并不具备自主性(Agency)——它无法主动采取行动、使用工具,也无法跨多个步骤持续完成目标。
而LLM Agent(大语言模型智能体)则彻底改变了这一模式。
Agent本质上是一种能够做到以下几点的大语言模型系统,其影响是深远的。
- 使用工具(如网页搜索、数据库查询、代码执行、API调用、邮件发送等)
- 为实现目标制定行动计划
- 根据每一步执行结果动态调整计划
- 在无需人工持续干预的情况下循环执行任务直至完成
- 传统RAG系统只能回答有关文档的问题;而Agent不仅能够阅读文档,还能够识别基于文档内容需要执行的操作,完成这些操作,验证执行结果,并向用户汇报结果——甚至能够自主处理执行过程中出现的异常情况。
这种差异并非渐进式改进,而是本质性的变革。
· 约45%:根据 McKinsey 2024 年研究,知识工作者的大约45%的工作任务具备部分或完全实现Agent自动化的潜力。
· ReAct:当前最主流的Agent推理范式:Reason(推理)+ Act(行动)
在每一步执行过程中交替进行。
· 10+:一个生产级LLM Agent通常能够访问十余种工具类型:
- 搜索引擎
- 代码执行环境
- 数据库
- API服务
- 文件系统
- 日历系统
- 邮件系统
- 等等
思维模式需要发生转变:不要再将大语言模型视为“问答机器”,而应将其理解为能够连接任意API、数据库和工具的推理引擎,并能够自主完成多步骤目标任务。
【45分钟内你将学到什么】
第14周课程将系统介绍完整的LLM Agent技术栈,从核心推理循环到生产级多智能体系统架构。
课程内容包含以下专题模块:
一、什么是LLM Agent?
1.Agent循环:观察(Observe)、思考(Think)、行动(Act)、观察(Observe)、重复执行(Repeat)
为什么这种循环机制与单次LLM调用存在本质区别。
2.工具调用(Tool Use / Function Calling):
LLM如何决定调用哪个工具、如何构造工具参数、如何解析并利用工具返回结果ReAct(Reasoning + Acting)
当前Agent领域最主流的推理框架。
3.模型在同一个上下文中交替执行:
Thought:
推理过程
Action:
工具调用
这种设计使得模型推理过程更加透明、可解释,并便于调试。
4.工具类型
生产环境中Agent常见工具包括:
Web搜索
代码执行(Python Sandbox)
数据库查询
REST API调用
文件读写(File I/O)
日历系统
邮件系统
向量数据库检索(将RAG作为工具使用)
5.记忆(Memory)
Agent的记忆机制主要包括:上下文记忆(In-context Memory) 会话历史记录。外部记忆(External Memory) 向量数据库存储。情景记忆(Episodic Memory) 对历史行动进行结构化总结与存储。
二、多智能体系统(Multi-agent Systems)
智能体之间如何协作、委派任务与相互验证为什么单个Agent难以完成复杂任务?
主要原因包括:
- 上下文窗口限制(Context Window Limit)
- 错误传播(Error Propagation)
- 缺乏专业化分工(Lack of Specialization)
- 缺少结果验证机制(No Verification)
- 多智能体协作模式Supervisor 模式 一个主管Agent负责:
- 分解任务
- 分配任务
- 管理多个专业Agent
- Peer-to-Peer 模式 多个Agent处于平等地位,通过相互通信完成协作。
Hierarchical 模式 分层组织结构:
- 上层Agent负责管理
- 下层Agent负责执行
- 具备任务升级(Escalation)机制
- AutoGen(Microsoft) 当前领先的多智能体框架之一。
- 核心能力包括:
- Human-in-the-loop(人类参与监督)
- 自动化Agent对话
- 沙盒环境中的代码执行
- Agent角色与人格设定(Persona & Role)
- CrewAI 基于角色分工的Agent协作框架。
支持:
- 结构化任务分配
- 工具共享
- 串行任务执行
- 并行任务执行
- Agent系统安全性:拥有工具调用能力的Agent,是当前风险最高的大语言模型部署模式之一。
重点风险包括:
Prompt Injection
过度权限问题
关键安全原则:
最小能力原则(Minimal Capability Principle)
Human-in-the-loop检查机制
对所有Agent行为进行审计记录(Audit Trail)
【谁应该参加本次公开课】
- 机器学习工程师(ML Engineers):已经构建过RAG系统(第12周课程)的学员,希望进一步升级为能够执行任务而不仅仅回答问题的Agent工作流。
- 后端工程师(Backend Engineers):正在集成LLM API,希望掌握可靠、安全的Agent架构设计方法,包括工具隔离和审计机制设计。
- 数据科学家(Data Scientists):希望利用Agent编排技术实现复杂分析流程自动化,包括:
数据获取
数据处理
数据分析
自动报告生成
- AI产品经理(AI Product Managers) 需要理解Agent功能的能力边界与潜在风险,从而更好地进行需求规划并与工程团队协作。
- AI研究人员(AI Researchers):正在构建自主智能系统,希望系统掌握当前主流Agent架构、框架及安全设计方法。
- 系列课程所有学员:Agent技术是整个课程体系的重要内容
主办方:AI聘 — 北美数据类、软件类求职服务一站式服务。
三大项目为你全程解除求职困扰:
1. 找到工作再付费的Career VIP项目,为全职岗位求职者提供最专业的支持;
2. Career Plus项目,为全职求职者提供短期强化训练,低成本一站式求职服务;
3. Intern VIP项目,为短期实习求职者提供内推、全程面试辅导支持。
可登录 www.aipin.io了解更多项目信息和成功案例。
邮箱: [email protected]
电话: +1 (626) 566 1822