Header Image
Loading Events

« All Events

Virtual Event Virtual Event

100天掌握大语言模型第十四周:LLM Agent Demo

June 11 @ 7:00 pm - 8:00 pm PDT

Virtual Event Virtual Event

 

“在过去十二周中,我们逐步构建了越来越强大的大语言模型:我们训练模型、微调模型,通过RAG赋予模型知识,并利用提示工程提升其推理能力。而第14周,则是大语言模型从‘等待提问’走向‘主动行动’的重要转折点。”

从“回答问题”到“执行任务”的范式转变

到目前为止,我们所构建的所有大语言模型应用都具有一个共同特征:模型等待人类提出问题,生成答案,然后停止运行。接下来由人类阅读答案,并决定下一步该采取什么行动。

换句话说,模型本身并不具备自主性(Agency)——它无法主动采取行动、使用工具,也无法跨多个步骤持续完成目标。

而LLM Agent(大语言模型智能体)则彻底改变了这一模式。

Agent本质上是一种能够做到以下几点的大语言模型系统,其影响是深远的。

  • 使用工具(如网页搜索、数据库查询、代码执行、API调用、邮件发送等)
  • 为实现目标制定行动计划
  • 根据每一步执行结果动态调整计划
  • 在无需人工持续干预的情况下循环执行任务直至完成
  • 传统RAG系统只能回答有关文档的问题;而Agent不仅能够阅读文档,还能够识别基于文档内容需要执行的操作,完成这些操作,验证执行结果,并向用户汇报结果——甚至能够自主处理执行过程中出现的异常情况。

这种差异并非渐进式改进,而是本质性的变革。

· 约45%:根据 McKinsey 2024 年研究,知识工作者的大约45%的工作任务具备部分或完全实现Agent自动化的潜力。

· ReAct:当前最主流的Agent推理范式:Reason(推理)+ Act(行动)

在每一步执行过程中交替进行。

· 10+:一个生产级LLM Agent通常能够访问十余种工具类型:

  • 搜索引擎
  • 代码执行环境
  • 数据库
  • API服务
  • 文件系统
  • 日历系统
  • 邮件系统
  • 等等

思维模式需要发生转变:不要再将大语言模型视为“问答机器”,而应将其理解为能够连接任意API、数据库和工具的推理引擎,并能够自主完成多步骤目标任务。

【45分钟内你将学到什么】

第14周课程将系统介绍完整的LLM Agent技术栈,从核心推理循环到生产级多智能体系统架构。

课程内容包含以下专题模块:

一、什么是LLM Agent?

1.Agent循环:观察(Observe)、思考(Think)、行动(Act)、观察(Observe)、重复执行(Repeat)

为什么这种循环机制与单次LLM调用存在本质区别。

2.工具调用(Tool Use / Function Calling):

LLM如何决定调用哪个工具、如何构造工具参数、如何解析并利用工具返回结果ReAct(Reasoning + Acting)

当前Agent领域最主流的推理框架。

3.模型在同一个上下文中交替执行:

Thought:

推理过程

Action:

工具调用

这种设计使得模型推理过程更加透明、可解释,并便于调试。

4.工具类型

生产环境中Agent常见工具包括:

Web搜索

代码执行(Python Sandbox)

数据库查询

REST API调用

文件读写(File I/O)

日历系统

邮件系统

向量数据库检索(将RAG作为工具使用)

5.记忆(Memory)

Agent的记忆机制主要包括:上下文记忆(In-context Memory) 会话历史记录。外部记忆(External Memory) 向量数据库存储。情景记忆(Episodic Memory) 对历史行动进行结构化总结与存储。

二、多智能体系统(Multi-agent Systems)

智能体之间如何协作、委派任务与相互验证为什么单个Agent难以完成复杂任务?

主要原因包括:

  • 上下文窗口限制(Context Window Limit)
  • 错误传播(Error Propagation)
  • 缺乏专业化分工(Lack of Specialization)
  • 缺少结果验证机制(No Verification)
  • 多智能体协作模式Supervisor 模式 一个主管Agent负责:
  • 分解任务
  • 分配任务
  • 管理多个专业Agent
  • Peer-to-Peer 模式 多个Agent处于平等地位,通过相互通信完成协作。

Hierarchical 模式 分层组织结构:

  • 上层Agent负责管理
  • 下层Agent负责执行
  • 具备任务升级(Escalation)机制
  • AutoGen(Microsoft) 当前领先的多智能体框架之一。
  • 核心能力包括:
  • Human-in-the-loop(人类参与监督)
  • 自动化Agent对话
  • 沙盒环境中的代码执行
  • Agent角色与人格设定(Persona & Role)
  • CrewAI 基于角色分工的Agent协作框架。

支持:

  • 结构化任务分配
  • 工具共享
  • 串行任务执行
  • 并行任务执行
  • Agent系统安全性:拥有工具调用能力的Agent,是当前风险最高的大语言模型部署模式之一。

重点风险包括:

Prompt Injection

过度权限问题

关键安全原则:

最小能力原则(Minimal Capability Principle)

Human-in-the-loop检查机制

对所有Agent行为进行审计记录(Audit Trail)

【谁应该参加本次公开课】

  • 机器学习工程师(ML Engineers):已经构建过RAG系统(第12周课程)的学员,希望进一步升级为能够执行任务而不仅仅回答问题的Agent工作流。
  • 后端工程师(Backend Engineers):正在集成LLM API,希望掌握可靠、安全的Agent架构设计方法,包括工具隔离和审计机制设计。
  • 数据科学家(Data Scientists):希望利用Agent编排技术实现复杂分析流程自动化,包括:

    数据获取

    数据处理

    数据分析

    自动报告生成

  • AI产品经理(AI Product Managers) 需要理解Agent功能的能力边界与潜在风险,从而更好地进行需求规划并与工程团队协作。
  • AI研究人员(AI Researchers):正在构建自主智能系统,希望系统掌握当前主流Agent架构、框架及安全设计方法。
  • 系列课程所有学员:Agent技术是整个课程体系的重要内容

 

主办方:AI聘 — 北美数据类、软件类求职服务一站式服务。

三大项目为你全程解除求职困扰:

1. 找到工作再付费的Career VIP项目,为全职岗位求职者提供最专业的支持;
2. Career Plus项目,为全职求职者提供短期强化训练,低成本一站式求职服务;
3. Intern VIP项目,为短期实习求职者提供内推、全程面试辅导支持。

可登录 www.aipin.io了解更多项目信息和成功案例。
邮箱: [email protected]
电话: +1 (626) 566 1822

Details

Date:
June 11
Time:
7:00 pm - 8:00 pm PDT
Event Category:
Event Tags:
, , , ,
免费注册讲座

Organizer

AI聘
Phone:
+1(626)566-1822
Email:
info@aipin.io
View Organizer Website