Header Image
Loading Events

« All Events

Virtual Event Virtual Event
  • This event has passed.

100天掌握大语言模型第十三周:LLM 智能体 · 工具使用 · LangChain · LlamaIndex · 多智能体系统

May 21 @ 7:00 pm - 8:00 pm PDT

Virtual Event Virtual Event
“我们花了十二周时间培养越来越强大的LLM学习模型:我们训练它们,微调它们,用RAG系统赋予它们知识,并教会它们在提示下进行推理。到了第十三周,逻辑学习模型不再等待指令,而是开始主动行动。”

被动应对到主动行动的转变

我们迄今为止构建的每个LLM应用都具有一个基本特征:模型等待用户提问,生成答案,然后停止运行。用户阅读答案并决定下一步操作。模型本身不具备自主性——无法在现实世界中采取行动、使用工具或执行多步骤目标。

LLM智能体彻底改变了这一切。智能体是一种LLM,它可以使用各种工具(例如搜索网络、查询数据库、执行代码、调用API、发送电子邮件),规划一系列行动以实现目标,观察每个行动的结果并调整其计划,并循环执行直至任务完成——整个过程无需人工干预。

其意义深远。RAG 系统可以回答关于文档的问题。代理可以读取文档,根据其内容识别需要采取的操作,执行这些操作,验证结果,并汇报——甚至可以自主处理异常情况。这并非渐进式的改进,而是本质上的变革。

约45%

知识工作者的很多任务都适合进行部分或全部的智能体自动化(麦肯锡 2024)。

反应

主导主体推理范式:推理与行动在每个步骤中交错进行

10岁以上

生产环境中的LLM代理可能访问的工具类型:搜索、代码、数据库、API、文件、日历、电子邮件……

 

思维模式的转变:停止将LLM视为问答机器,而应将其视为推理引擎,它可以连接到任何API、任何数据库和任何工具,然后自主地追求多步骤目标。

45分钟内你将学到什么

第 13 周涵盖了 LLM 智能体的完整技术栈——从核心推理循环到生产级多智能体系统。包含四个深入探讨的主题模块:

01什么是LLM代理人?

智能体循环、工具使用和ReAct推理范式

• 智能体循环:观察 → 思考 → 行动 → 观察 → 重复。为什么这个循环与单个 LLM 调用有着本质区别?

• 工具使用(函数调用):LLM 如何决定使用哪个工具、传递哪些参数以及如何解释结果

• ReAct(推理+行动):主流范式。该模型将“思考”步骤(推理)与“行动”步骤(工具调用)交错置于同一上下文中,使推理过程透明且易于调试。

• 工具类型:网络搜索、代码执行(Python 沙箱)、数据库查询、REST API 调用、文件 I/O、日历、电子邮件、矢量存储检索(RAG 作为工具)

• 记忆:情境记忆(对话历史)、外部记忆(向量存储)、情景记忆(过去行为的结构化摘要)

 

02多智能体系统

能够协作、委派任务并互相检查工作成果的代理人

• 单个智能体在复杂任务中失败的原因:上下文窗口限制、错误传播、缺乏专业化、缺乏验证

• 多智能体模式:主管模式(一个智能体分解任务并委派给专业智能体)、点对点模式(智能体之间平等沟通)、层级模式(具有升级路径的分层智能体团队)

• AutoGen(微软):领先的多智能体框架。支持人机交互、自动化对话、沙盒环境下的代码执行、智能体角色和配置。

• CrewAI:基于角色的智能体团队,具备结构化的任务分配、工具共享以及顺序/并行任务执行能力。

• 智能体系统中的安全:为什么拥有工具访问权限的智能体是风险最高的LLM部署模式。智能体上下文中的快速注入、最小能力原则、人机交互检查点、所有智能体操作的审计跟踪。

为什么代理人是LLM中最需要理解的内容

人工智能行业已经迅速从“LLM可以回答问题”发展到“LLM可以采取行动”。这种转变发生的速度比大多数从业者意识到的要快得多,并且给那些没有做好准备的团队带来了真正的部署风险。

机会

智能体可以自动化以往需要人工判断的整个工作流程。客户支持工单处理、代码审查和生成流程、研究成果汇总、数据分析和报告、需要数据库查询的内部知识问答——所有这些如今都已部署为智能体系统。

风险

拥有工具访问权限的智能体可以执行现实世界的操作:发送电子邮件、修改数据库、执行代码、调用外部 API。而产生幻觉、被注入恶意指令或追求错误目标的智能体,则可能造成仅支持文本的逻辑逻辑模型无法造成的损害。二者在安全考量上截然不同。

第 13 周涵盖了双方——力量和风险——因为成功部署代理的团队正是那些了解这两方面的团队。

谁应该参加

机器学习工程师 已经构建了 RAG 系统(第 12 周)并希望将其发展为可以执行操作而不仅仅是回答问题的代理管道的人。

 

后端工程师 正在集成 LLM API 并希望了解如何构建可靠、安全的代理工作流,并具有适当的工具隔离和审计跟踪的用户。

 

数据科学家 希望使用代理编排实现多步骤分析工作流程(数据检索、处理、分析和报告生成)自动化的用户。

 

人工智能产品经理 在确定产品需求和与工程团队沟通时,哪些人需要了解基于代理的功能的能力和风险?

 

人工智能研究人员 那些正在构建自主系统,并且需要对当前的代理架构、框架和安全考虑因素有严格了解的人员。

 

系列中的所有人 智能体是我们所有努力的最终成果:LLM理解(第1-6周)、微调(第7周)、RAG(第8和12周)、评估(第9周)、安全(第10周)和提示(第11周)。所有这些都在这里汇聚。

 

————————————-

主办方:AI聘 — 北美数据类、软件类求职服务一站式服务。

三大项目为你全程解除求职困扰:

1. 找到工作再付费的Career VIP项目,为全职岗位求职者提供最专业的支持;
2. Career Plus项目,为全职求职者提供短期强化训练,低成本一站式求职服务;
3. Intern VIP项目,为短期实习求职者提供内推、全程面试辅导支持。

可登录 www.aipin.io了解更多项目信息和成功案例。
邮箱: [email protected]
电话: +1 (626) 566 1822

Details

Date:
May 21
Time:
7:00 pm - 8:00 pm PDT
Event Category:
Event Tags:
, , , ,
免费注册讲座

Organizer

AI聘
Phone:
+1(626)566-1822
Email:
info@aipin.io
View Organizer Website