核心内容摘要
序列化巨坑:Parcelable 与 Serializable 的隐形陷阱
1 Agent是什么简单来说Agent就是什么一个能感知环境、决策并行动以实现目标的智能体。
像ChatGPT这样的基础LLM本质上已经具备Agent的雏形它能理解问题环境感知决定如何回答决策并生成回复行动。
但真正的Agent需要更强大的自主能力包括反思、规划和协作等高级功能。
这些正是将基础LLM升级为高级Agent的核心要素。
2 Agentic是什么Agentic是一个形容词用于描述系统表现出的类似Agent的特性程度。
系统越具有Agentic特性就越能展现出自主性、目标导向和主动行为。
它代表的不是具体实体而是一种行为模式或设计理念。
低 Agentic 系统一个简单的聊天机器人只能根据预设规则回答问题。
高 Agentic 系统一个能自动调试代码、部署应用并监控其运行状态的 AI 软件工程师。
OpenAI的AI主管 Lilian Weng在她那篇关于自主智能体Autonomous Agents的里程碑式博客文章《LLM Powered Autonomous Agents》中所强调的具备智能体特性agentic的 AI不会傻傻地等待下一步指令而是会主动进行思考我所理解的发现自己犯了错然后自己去修正。
意识到需要外部信息然后主动去调用工具。
面对复杂任务时自己去拆解成小步骤。
智能体作为载体其强大能力的核心在于规划、记忆和工具使用等关键组件这正是本文系统阐述的重点。
《LLM Powered Autonomous Agents》堪称智能体系统领域的里程碑之作它不仅系统梳理了智能体核心概念提出ReAct等创新模式构建了完整的理论框架还通过详实案例为工程实践提供指导更重要的是推动了AI从被动响应到主动解决问题的范式转变。
文章以通俗易懂的语言架起学术与工业的桥梁促进了技术普及对智能体系统的研究和应用产生了深远影响。
Agentic特性通过多种具体的工作模式得以实现。
我们将重点分析五种最常见的Agentic模式这些模式决定了Agent在不同场景下的行为特征。
值得注意的是这些模式的演变与ReAct思想密切相关而ReAct被视为开创了Agentic系统设计的先河。
3 Agent的五种模式Five Modes of an Agent
1 ⼯具使⽤模式Tool use pattern核心要点工具使用模式可视为ReAct模式的雏形或简化版本。
该模式支持Agent调用外部工具补充知识短板但相比ReAct模式精细的思考-行动-观察循环其推理能力较为薄弱。
这种模式主要适用于单步执行的简单任务缺乏动态调整和迭代优化的能力。
工作流程像请教专家用户问问题提出一个问题。
LLM 想想小助手判断需要外援。
调用工具它找来数据库或 API 查资料。
给出答案根据查到的东西生成回复。
交给你答案回到你手里。
应用场景示例智能客服当客服系统收到查询我的订单状态请求时系统会先分析需求然后精准调用query_order_status(order_id)接口获取数据最后基于查询结果向用户提供准确答复。
2 ReAct 模式 (ReAct Pattern)高级Agent模式的核心机制普遍采用ReActReasoning Acting框架。
该框架通过思考-行动的闭环循环赋予Agent类人的决策能力。
核心理念ReAct模式是Agent智能的基石它创新性地将推理Reasoning与执行Acting有机融合形成动态迭代的认知过程。
不同于简单的工具调用这种模式使Agent具备类似人类的实时决策能力。
该理论由Yao团队在2022年发表的论文《ReAct: Synergizing Reasoning and Acting in Language Models》中首次提出后经Lilian Weng的系统性阐释成为Agent系统设计的标准范式。
工作流程思考Agent接收用户请求推理任务需求并制定初步行动计划。
行动根据思考结果决定并执行具体行动如调用工具。
行动输入为选定的工具提供必要参数。
观察接收工具执行结果作为对环境的“观察”。
循环迭代将观察结果反馈给自己再次思考并决定下一步直到达到目标。
应用场景示例研究助理agent任务是“查找关于‘大型语言模型在教育领域的应用’的最新研究论文”。
Thought: 我需要去学术搜索引擎搜索相关论文。
Action:search_arxiv(large language models in education)Observation: 返回了10篇的标题和摘要Thought: 结果太多了我需要筛选出最近一年且被引用次数最多的论文。
Action:filter_papers(results, min_year2023, sort_bycitations)Observation: 返回了3篇最相关的论文Thought: 我已经找到了最相关的论文现在可以
总结并回答用户了。
3 反思模式Reflection pattern为确保任务执行质量Agent 会在完成每个步骤或整体任务后进行自我评估与反思并根据反思结果及时调整优化。
核心精髓反思模式是ReAct 模式中“思考”环节的深化。
它强调 Agent 在完成任务后能够像人类一样进行自我审查和评估。
这个过程让 Agent 能够从错误中学习持续优化自己的表现。
工作流程用户问问题你给小助手提个问题。
LLM 给出初稿小助手先试着回答写个初步答案。
用户反馈用户查看答案行不行提出意见。
LLM 自己反思小助手想想哪里不对改改答案。
反复调整可能来回改几次直到你满意。
交给你最终答案交到你手里。
应用场景示例AI代码生成器任务是“写一个 Python 函数来计算斐波那契数列”。
Action: Agent 快速生成了一个使用递归实现的函数。
Reflection (Self-Critique): Agent 开始反思生成的代码。
“这个递归实现在计算较大数值时会因为重复计算而导致性能低下。
我应该优化它。
”Action (Refinement): Agent 重新编写代码使用了带缓存memoization的动态规划方法大大提高了效率然后将优化后的代码作为最终答案。
4 规划模式Planning Pattern面对复杂任务时若无法通过简单ReAct循环直接完成Agent需先制定宏观规划方案。
核心理念将宏观目标拆解为系统化、结构化的执行方案Plan再按步骤逐步推进每个步骤可视为独立的 ReAct 循环。
应用场景示例AI旅行规划师任务是“帮我规划一个为期五天的巴黎家庭亲子游”。
Planning Phase: Agent 首先生成一个计划步骤一确定旅行日期和预算。
步骤二根据亲子游的特点搜索并筛选合适的景点。
步骤三规划每日行程确保节奏轻松并预订门票。
步骤四搜索并推荐适合家庭入住的酒店和餐厅。
步骤五汇总所有信息生成一份详细的旅行计划文档。
Execution Phase: Agent 开始按顺序执行上述步骤每一步都可能调用搜索、预订等工具。
5 多智能体模式 (Multi-agent Pattern)面对高度复杂的系统性任务时单个智能体往往难以独立完成。
此时我们可以构建由多个具备差异化角色和能力的智能体组成的协作系统通过分工合作来提升整体效能。
核心要义多智能体模式是Agentic理念的完美诠释它完美复刻了人类团队协作的工作机制。
通过构建多个专业分工的智能体让它们各展所长、协同配合共同攻克复杂任务。
虽然多智能体模式优势显著但在实现过程中仍需解决智能体间通信效率、任务协调等关键问题这对系统架构提出了更严苛的标准。
应用场景软件开发过程用户问问题用户提个大需求比如开发一个软件项目。
PM Agent项目经理 Agent 分析需求并分配任务协调整个团队。
委托任务任务交给 DevOps 和 Tech LeadDevOps 负责运维Tech Lead 负责技术领导。
执行任务DevOps处理部署和测试 和 SDE编写代码干活具体实施任务。
结果汇总大家干完后把结果汇报给 PM Agent统一收集反馈。
交付PM Agent 整合所有结果给用户最终答案交付完成的项目。
6 Agent 模式的演进关系上述5种模式构成了一个从简单到复杂的演进阶梯Tool Use (基础)-ReAct (核心循环)-Planning (宏观规划)-Reflection (质量保证)-Multi-Agent (规模化协作)ReAct是Tool Use的规范化和显式化让工具使用变得有迹可循。
Planning是在执行多个ReAct循环之前的高层战略制定。
Reflection是对ReAct或Planning执行结果的检查与优化。
Multi-Agent是将多个可能使用上述所有模式的 Agent 组织起来形成一个系统。
通过上述的agent模式的演进过程它清晰地指明了“如何一步步构建一个更强大的 Agent”。
TIPS:真正强大的 Agent 系统不会局限于单一模式。
它会根据任务复杂度智能地组合多种模式协同工作。
比如在处理复杂任务时Agent 可以先用规划模式分解任务将子任务分配给采用 ReAct 模式的执行者执行过程中调用各类工具遇到困难时启动反思模式调整策略这种组合与嵌套能力正是Agentic系统得以应对现实世界复杂任务的关键所在。
目录1 Agent是什么2 Agentic是什么3 Agent的五种模式Five Modes of an Agent