核心内容摘要
唐伯虎心糖:一口甜蜜,点亮你的生活!免费播放,即刻畅享!
本文详细介绍了Agentic工作流的概念区别于传统工作流它由AI agent动态执行具备规划、工具使用和反思三大模式。
文章探讨了Agentic工作流在RAG、研究助手和编程助手等场景的应用通过实际案例展示了其实现方式并分析了其灵活适应、自我学习等优势以及可能带来的复杂性和可靠性挑战。
什么是AI agentAI agent是结合LLM推理和决策能力与交互工具的系统能够在有限人类参与下完成复杂任务。
Agent被分配特定角色并拥有不同程度的自主权以完成最终目标。
它们还配备记忆功能使其能从过去经验中学习并提升性能。
为了更好地理解AI agent如何融入Agentic工作流我们将探讨AI agent的核心组成部分。
AI Agent的组成部分尽管AI agent设计用于半自主决策但它们依赖更大的组件框架才能正常运作。
这个框架由使agent有效推理的LLM、帮助agent完成任务的工具以及允许agent从过去经验中学习并改进的记忆组成。
推理AI agent的有效性部分源于其迭代推理能力使agent在整个问题解决过程中能够主动思考。
AI agent的推理能力来自其底层LLM主要服务于规划和反思两个功能。
在规划阶段agent执行任务分解将复杂问题分解为更小、可操作的步骤。
这种技术使agent能系统地处理任务并为不同任务使用不同工具。
它还支持查询分解将复杂查询分解为更简单的查询提高LLM响应的准确性和可靠性。
Agent还通过反思其行动结果进行推理。
这使它们能基于结果和从外部来源获取的数据评估并迭代调整行动计划。
工具LLM拥有静态的参数化知识意味着其理解仅限于训练时编码的信息。
为扩展超出原始数据集的能力agent可利用外部工具如网络搜索引擎、API、数据库和计算框架。
这意味着agent能访问实时外部数据来指导决策完成需要与其他应用交互的任务。
工具通常与权限配对如查询API、发送消息或访问特定文档或数据库架构的能力。
工具任务Internet search检索并
总结实时信息。
Vector search检索并
总结外部数据。
Code interpreter迭代运行由agent生成的代码。
API检索实时信息并使用外部服务和应用执行任务。
当LLM选择工具帮助完成任务时它进行函数调用延伸其简单文本生成之外的能力实现与现实世界的交互。
工具选择可由最终用户预先确定或交由agent决定。
让agent动态选择工具有助于解决更复杂任务但对于较简单的工作流可能增加不必要的复杂性。
记忆从过去经验学习并记住行动发生的上下文是区分Agent工作流与纯LLM驱动工作流的部分因素。
记忆是捕获和存储跨多个用户交互和会话的上下文和反馈的关键组件。
Agent有两种主要记忆类型短期记忆和长期记忆。
短期记忆存储更即时的信息如对话历史帮助agent确定下一步行动。
长期记忆存储随时间积累的信息和知识实现agent的个性化和随时间改进性能。
什么是Agentic 工作流一般而言工作流是为实现特定任务或目标设计的一系列连接步骤。
最简单的工作流是确定性的遵循预定义步骤序列无法适应新信息或变化条件。
例如自动化费用审批工作流可能是“如果费用标记为’餐饮’且低于30美元自动批准。
”然而一些工作流利用LLM或其他机器学习模型或技术这些通常被称为AI工作流可以是agentic或非agentic的。
在非agentic工作流中LLM接收指令并生成输出。
例如文本摘要工作流将较长文本作为输入提示LLM进行摘要并返回摘要结果。
但仅使用LLM的工作流并不一定是agentic的。
Agentic 工作流是由一个或多个agent动态执行的一系列连接步骤用于实现特定任务或目标。
Agent被用户授予权限享有有限自主权收集数据、执行任务并作出现实世界执行的决策。
Agentic工作流还利用AI agent的核心组件包括推理能力、使用工具与环境交互的能力以及持久记忆将传统工作流完全转变为响应式、适应性和自我演化的流程。
什么使工作流成为Agentic工作流当一个或多个agent引导和塑造任务进程时AI工作流变为agentic工作流。
将agent添加到现有非agentic工作流创造混合方法可以同时结合结构化工作流的可靠性和可预测性与LLM的智能和适应性。
Agentic 工作流的特点是制定计划Agentic 工作流始于规划。
LLM通过任务分解将复杂任务拆分为更小子任务然后确定最佳执行路线。
利用工具执行行动Agentic 工作流使用预定义工具及权限完成任务并执行生成的计划。
反思和迭代Agent能评估每步结果在需要时调整计划并循环直至结果满意。
如你所见我们需要区分三种类型的工作流传统非AI工作流、非 agentic 型AI工作流和agentic 型工作流。
传统规则基础工作流与AI工作流的区别在于前者使用预定义步骤而后者使用AI模型来完成任务。
其次非 agentic 型与 agentic 型AI工作流的区别在于前者使用静态AI模型后者使用动态AI agent。
这使得agentic 型工作流比非 agentic 型工作流更具适应性和动态性。
agentic架构与agent工作流的区别新兴技术总伴随术语洪流。
虽然有人可能交替使用agent architectures和agentic workflows但二者有重要区别。
Agentic 工作流是agent为实现特定目标采取的步骤序列。
这些步骤可能包括使用LLM创建计划、将任务分解为子任务、使用工具完成任务以及使用LLM反思任务结果并调整总体计划。
Agentic架构则是用于完成给定任务的技术框架和整体系统设计。
Agentic架构多样创新但总包含至少一个具备决策和推理能力的agent、agent可用工具以及短期和长期记忆系统。
Agentic工作流中的模式回顾Agentic工作流是为完成特定任务即最终目标而采取的结构化步骤系列。
讨论Agentic工作流时我们讨论的是使agent能够实现最终目标的特定行为模式。
AI agent的核心组件在Agentic工作流模式中发挥关键作用。
agent的推理能力促进了规划和反思模式而其使用工具与环境交互的能力构成了工具使用模式的基础。
规划模式规划设计模式允许agent自主将复杂任务分解为更小更简单任务系列即任务分解。
任务分解产生更好结果因为它减轻LLM认知负担改进推理并最小化幻觉和其他不准确性。
当实现最终目标的方法不明确且问题解决过程中适应性至关重要时规划特别有效。
例如指示修复软件漏洞的AI agent可能使用规划模式将任务分解为阅读漏洞报告、识别相关代码段、生成潜在原因列表最后选择特定调试策略等子任务。
如首次修复尝试失败agent可阅读执行后错误消息并调整策略。
虽然规划有助于agent更好处理复杂任务但也可能导致比确定性工作流更不可预测的结果。
因此最好仅在需要密集问题解决和多跳推理的任务中使用规划模式。
工具使用模式生成式LLM的重要限制是依赖预先存在的训练数据意味着它们无法检索实时信息或验证超出已学习内容的事实。
因此在不知道答案时可能生成非事实响应或猜测。
检索增强生成(RAG)通过为LLM提供相关实时外部数据缓解此限制实现更准确和具有上下文依据的响应。
然而工具使用超越简单RAG允许LLM动态交互现实世界而非仅从中检索数据。
在Agent工作流中工具使用模式通过允许agent与外部资源和应用、实时数据或其他计算资源交互扩展其能力。
常见工具包括API、信息检索如向量搜索、网络浏览器、机器学习模型和代码解释器。
这些工具用于执行特定任务如搜索网络、从外部数据库检索数据或读取/发送电子邮件帮助agent达成目标。
反思模式反思是一种强大的agent设计模式实现相对简单且可显著提升Agent工作流效果。
反思模式是agent在最终响应或进一步行动前迭代评估其输出或决策质量的自我反馈机制。
这些批评用于完善agent方法、纠正错误并改进未来响应或决策。
当agent不太可能首次成功完成目标任务时反思特别有用如编写代码。
在这种情况下agent可能生成代码片段在沙盒或执行环境中运行并迭代将错误反馈回LLM指导其改进代码直至成功执行。
反思的力量在于agent能够批评自己的输出并动态将这些见解整合到工作流中无需直接人类反馈实现持续改进。
这些反思可编码进agent记忆使当前用户会话中问题解决更高效并通过适应用户偏好改善未来交互实现个性化。
Agentic工作流应用场景原子设计模式如规划和工具使用可创造性组合有效利用agentic AI完成各领域多样任务。
除组合设计模式外AI agent还可配备不同工具组合甚至授予动态选择所需工具的能力。
它们还可与人类反馈循环集成并赋予不同自主和决策权限级别。
这些多样配置使Agent工作流可针对各行业广泛任务定制。
为展示这一点我们概述两个特别强大的应用场景agent增强的检索生成(Agentic RAG)和agent研究助手。
Agent增强的检索生成(Agentic RAG)检索增强生成(RAG)是通过提供从外部数据源检索的相关数据增强LLM知识的框架。
Agentic RAG将一个或多个agent整合进RAG流程。
在规划阶段agent可通过查询分解将复杂查询分解为更小子查询或确定是否需向用户请求额外信息完成请求。
AI agent还可用于评估检索数据和响应的相关性和准确性再传递给用户。
如响应不满意agent可重新构建查询、重新审视查询分解步骤甚至创建响应查询的新计划。
Agentic 研究助手Agentic 研究助手某些AI公司称为深度研究通过搜索网络和各种外部数据生成复杂主题的深入报告和详细见解。
这些助手利用Agentic RAG响应用户查询从网络和其他外部源检索信息。
然而与传统RAG不同这些助手能综合和分析信息而非仅从外部源检索相关数据增强LLM生成输出。
这种独特能力归因于几个特点。
首先Agentic 研究助手通常使用专为网络浏览、任务分解和动态规划微调的LLM。
其次这些工作流中的agent主动寻求用户指导请求额外信息或澄清以更好理解最终目标。
第三这些agent能根据检索信息调整计划并改变路线意味着它们在综合新信息时能追求新的有趣角度并连续查询多个数据源直至获取必要数据。
因此Agentic 研究助手能获得更深入见解识别随时间变化的趋势并编译主题完整报告而非仅检索现有知识。
Agentic 编程助手Agentic 编程助手能以最少人类干预生成、重构、完善和调试代码。
非agentic编程助手如GitHub Copilot第一版由微调生成代码的生成式LLM驱动但仅限于生成代码。
使编程助手agentic的是其与环境交互的能力——执行生成代码并基于执行结果、错误或反馈迭代完善。
这些助手还可获权限通过创建提交和PR更改现有代码库如Anthropic的Claude Code这是自动化软件开发过程的重要一步。
Agentic编程助手还可建议终端命令和其他代码更改/添加并等待明确人类批准后执行如Cursor的Agent使人类完全控制agent。
此外重要的是Agentic 编程助手能通过将错误编码进长期记忆从中学习随时间变得更智能。
Agentic工作流示例了解了Agentic工作流的应用场景后我们将详细看两个真实世界agentic的工作流步骤Clay的Claygent和ServiceNow AI Agents。
每个工作流使用独特模式和工具组合赋予agent不同自主和决策能力并依赖不同级别人类反馈和参与。
Claygent (Clay)潜在客户研究和数据增长可能是增长和销售团队的一项繁琐任务。
数据丰富和外联自动化公司Clay通过Claygent简化这一过程——一个持续扫描网络和内部数据库提供实时可操作见解的AI驱动研究agent。
假设你想使用Claygent基于姓名和电子邮件列表丰富LinkedIn档案并发送个性化介绍信息。
首先指定你寻找的数据字段如工作经验、教育、技能注入预配置提示模板。
agent的LLM处理查询使用网络抓取工具搜索LinkedIn URL并从LinkedIn档案提取所需数据。
然后这些数据可发送给另一个LLM你可指示其按需摘要或分析丰富数据。
同一LLM或不同LLM随后可用于为每个档案创建个性化外联信息。
Claygent是相对灵活的Agentic工作流示例可创造性定制同时通过特定任务预配置提示模板为agent提供指导。
ServiceNow AI AgentsServiceNow是简化和自动化IT、运营、HR和客户服务领域工作流的云平台。
其ServiceNow平台现提供AI agent访问旨在自动化重复任务和预先存在的工作流同时保留人类完全决策控制权。
以下是Agentic工作流如何帮助解决技术支持案例的示例。
工作流在客户提交技术支持票据时触发。
票据信息传递给执行内部IT支持知识库RAG的一个或多个agent。
agent
总结发现分析类似案例并为IT支持专家生成摘要。
最后它生成如何继续的建议专家可批准或拒绝。
ServiceNow AI Agents代表创新但更谨慎的生产环境部署agent方法赋予它们严格角色和任务并限制影响最终用户或客户的决策自主权。
Agentic工作流的优势与局限性AI agent已迅速超越机器学习社区进入主流。
鉴于围绕agentic AI的所有兴奋、期待和期望区分炒作与现实、理解其真实能力和局限性可能困难。
本节提供Agent工作流优势、挑战和局限性的平衡视角。
Agentic工作流的优势Agentic工作流超越传统自动化使AI agent能规划、适应并随时间改进。
与遵循固定规则的确定性工作流不同Agentic工作流能动态响应复杂性通过反馈完善方法并扩展处理更高级任务。
这种适应性在需要灵活性、学习和决策的场景中特别有价值。
Agentic工作流的优势包括灵活性、适应性和可定制性静态确定性工作流难以适应不断发展的情况和意外困难。
相反Agentic工作流提供基于任务难度调整和演化的灵活性确保始终保持相关性并提供最佳解决方案。
它们还可通过组合不同模式定制实现模块化设计随需求和复杂性增长迭代升级。
复杂任务性能改进通过将复杂任务分解为更小可管理步骤通过任务分解和规划Agentic工作流显著优于确定性、零样本方法。
自我纠正和持续学习反思模式允许Agentic工作流评估自身行动完善策略随时间改进结果。
利用短期和长期记忆它们从过去经验学习每次迭代变得更有效和个性化。
运营效率和可扩展性Agentic工作流能高准确度自动化重复任务如构建正确减少特定场景中人工工作和运营成本。
它们还易于扩展非常适合处理更大工作负载或复杂系统。
AI agent仍是新兴技术随着研究人员和用户发现将agent整合进工作流的新方法这份优势清单可能扩展。
Agentic工作流的挑战和局限性尽管具备优势和创新特性AI agent也面临许多挑战和局限。
由于其概率性质AI agent本质上为工作流增加复杂性。
仅因agent能用于自动化流程并不意味着它们应该被使用。
以下是Agentic工作流最显著的挑战和局限简单任务不必要的复杂性用于表单录入或基本数据提取等直接工作流时AI agent可能增加开销。
在确定性规则基础自动化足够的情况下引入agent可能导致效率降低、额外费用甚至性能下降。
自主性增加导致可靠性降低随着agent在工作流中获得更多决策权其概率性质可能引入不可预测性使输出可靠性降低、更难控制。
实施并积极维护agent护栏并持续审查授予权限至关重要。
伦理和实际考量并非所有决策都应委托给AI系统。
在高风险或敏感领域使用agent需谨慎监督确保负责任部署并防止意外后果。
鉴于这些局限我们建议花时间反思在给定工作流中使用agent是否真正必要。
帮助确定的问题可能包括任务是否足够复杂需要自适应决策或确定性方法是否足够更简单的AI辅助工具如不含agent的RAG是否能达成相同结果工作流是否涉及不确定性、变化条件或多步推理agent能更有效处理赋予agent自主权相关风险是什么能否缓解
总结Agentic工作流是强大工具帮助自动化完成需要决策和推理的复杂任务。
本文回顾了AI agent核心组成部分包括记忆、工具和推理能力及其对Agentic工作流的贡献。
我们还讨论了常见工作流模式如规划、工具使用和反思它们可单独或组合使用创建动态工作流。
此外我们概述了两个特别有效的应用场景agent增强的检索生成和agent研究助手并描述了Clay的Claygent和ServiceNow的AI Agents两个已上市agent背后的工作流。
最后我们提及了Agentic工作流的优势以及其局限和挑战。
AI agent背后的技术持续发展我们对它们的理解也在进化。
本文旨在为你提供AI agent在工作流中如何运作的基本理解但绝非该主题的详尽探索。
如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。
但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。
这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。
我在一线互联网企业工作十余年里指导过不少同行后辈。
帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。
但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】为什么要学习大模型我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。
2023年人才缺口已超百万凸显培养不足。
随着AI技术飞速发展预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。
加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。
大模型入门到实战全套学习大礼包
大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。
正确的学习路线可以为你节省时间少走弯路方向不对努力白费。
这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通
大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。
AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。
大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。
大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。
在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。
适用人群第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。
大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-
5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。
快速开发一个完整的基于 agent 对话机器人。
掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。
为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。
到此为止大概2个月的时间。
你已经成为了一名“AI小子”。
那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。
硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。
天道酬勤你越努力就会成为越优秀的自己。
如果你能在15天内完成所有的任务那你堪称天才。
然而如果你能完成
% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】