Virtual Event

100天掌握大语言模型第十四周：LLM Agent Demo

June 11 @ 7:00 pm - 8:00 pm PDT

Virtual Event

“在过去十二周中，我们逐步构建了越来越强大的大语言模型：我们训练模型、微调模型，通过RAG赋予模型知识，并利用提示工程提升其推理能力。而第14周，则是大语言模型从‘等待提问’走向‘主动行动’的重要转折点。”

从“回答问题”到“执行任务”的范式转变

到目前为止，我们所构建的所有大语言模型应用都具有一个共同特征：模型等待人类提出问题，生成答案，然后停止运行。接下来由人类阅读答案，并决定下一步该采取什么行动。

换句话说，模型本身并不具备自主性（Agency）——它无法主动采取行动、使用工具，也无法跨多个步骤持续完成目标。

而LLM Agent（大语言模型智能体）则彻底改变了这一模式。

Agent本质上是一种能够做到以下几点的大语言模型系统，其影响是深远的。

使用工具（如网页搜索、数据库查询、代码执行、API调用、邮件发送等）
为实现目标制定行动计划
根据每一步执行结果动态调整计划
在无需人工持续干预的情况下循环执行任务直至完成
传统RAG系统只能回答有关文档的问题；而Agent不仅能够阅读文档，还能够识别基于文档内容需要执行的操作，完成这些操作，验证执行结果，并向用户汇报结果——甚至能够自主处理执行过程中出现的异常情况。

这种差异并非渐进式改进，而是本质性的变革。

· 约45%：根据 McKinsey 2024 年研究，知识工作者的大约45%的工作任务具备部分或完全实现Agent自动化的潜力。

· ReAct：当前最主流的Agent推理范式：Reason（推理）+ Act（行动）

在每一步执行过程中交替进行。

· 10+：一个生产级LLM Agent通常能够访问十余种工具类型：

搜索引擎
代码执行环境
数据库
API服务
文件系统
日历系统
邮件系统
等等

思维模式需要发生转变：不要再将大语言模型视为“问答机器”，而应将其理解为能够连接任意API、数据库和工具的推理引擎，并能够自主完成多步骤目标任务。

【45分钟内你将学到什么】

第14周课程将系统介绍完整的LLM Agent技术栈，从核心推理循环到生产级多智能体系统架构。

课程内容包含以下专题模块：

一、什么是LLM Agent？

1.Agent循环：观察（Observe）、思考（Think）、行动（Act）、观察（Observe）、重复执行（Repeat）

为什么这种循环机制与单次LLM调用存在本质区别。

2.工具调用（Tool Use / Function Calling）：

LLM如何决定调用哪个工具、如何构造工具参数、如何解析并利用工具返回结果ReAct（Reasoning + Acting）

当前Agent领域最主流的推理框架。

3.模型在同一个上下文中交替执行：

Thought：

推理过程

Action：

工具调用

这种设计使得模型推理过程更加透明、可解释，并便于调试。

4.工具类型

生产环境中Agent常见工具包括：

Web搜索

代码执行（Python Sandbox）

数据库查询

REST API调用

文件读写（File I/O）

日历系统

邮件系统

向量数据库检索（将RAG作为工具使用）

5.记忆（Memory）

Agent的记忆机制主要包括：上下文记忆（In-context Memory）会话历史记录。外部记忆（External Memory）向量数据库存储。情景记忆（Episodic Memory）对历史行动进行结构化总结与存储。

二、多智能体系统（Multi-agent Systems）

智能体之间如何协作、委派任务与相互验证为什么单个Agent难以完成复杂任务？

主要原因包括：

上下文窗口限制（Context Window Limit）
错误传播（Error Propagation）
缺乏专业化分工（Lack of Specialization）
缺少结果验证机制（No Verification）
多智能体协作模式Supervisor 模式一个主管Agent负责：
分解任务
分配任务
管理多个专业Agent
Peer-to-Peer 模式多个Agent处于平等地位，通过相互通信完成协作。

Hierarchical 模式分层组织结构：

上层Agent负责管理
下层Agent负责执行
具备任务升级（Escalation）机制
AutoGen（Microsoft）当前领先的多智能体框架之一。
核心能力包括：
Human-in-the-loop（人类参与监督）
自动化Agent对话
沙盒环境中的代码执行
Agent角色与人格设定（Persona & Role）
CrewAI 基于角色分工的Agent协作框架。

支持：

结构化任务分配
工具共享
串行任务执行
并行任务执行
Agent系统安全性：拥有工具调用能力的Agent，是当前风险最高的大语言模型部署模式之一。

重点风险包括：

Prompt Injection

过度权限问题

关键安全原则：

最小能力原则（Minimal Capability Principle）

Human-in-the-loop检查机制

对所有Agent行为进行审计记录（Audit Trail）

【谁应该参加本次公开课】

机器学习工程师（ML Engineers）：已经构建过RAG系统（第12周课程）的学员，希望进一步升级为能够执行任务而不仅仅回答问题的Agent工作流。
后端工程师（Backend Engineers）：正在集成LLM API，希望掌握可靠、安全的Agent架构设计方法，包括工具隔离和审计机制设计。
数据科学家（Data Scientists）:希望利用Agent编排技术实现复杂分析流程自动化，包括：
数据获取

数据处理

数据分析

自动报告生成
AI产品经理（AI Product Managers）需要理解Agent功能的能力边界与潜在风险，从而更好地进行需求规划并与工程团队协作。
AI研究人员（AI Researchers）:正在构建自主智能系统，希望系统掌握当前主流Agent架构、框架及安全设计方法。
系列课程所有学员：Agent技术是整个课程体系的重要内容

主办方：AI聘 — 北美数据类、软件类求职服务一站式服务。

三大项目为你全程解除求职困扰：

1. 找到工作再付费的Career VIP项目，为全职岗位求职者提供最专业的支持；
2. Career Plus项目，为全职求职者提供短期强化训练，低成本一站式求职服务；
3. Intern VIP项目，为短期实习求职者提供内推、全程面试辅导支持。

可登录 www.aipin.io了解更多项目信息和成功案例。
邮箱: [email protected]
电话: +1 (626) 566 1822

+ Google Calendar + iCal Export

Details

Date:: June 11
Time:: 7:00 pm - 8:00 pm PDT
Event Category:: 直播讲座
Event Tags:: 数据科学家, 求职, 美国求职, 美国留学生求职, 面试

Organizer

: AI聘
Phone:: +1(626)566-1822
Email:: info@aipin.io; View Organizer Website