核心内容摘要
【深度收藏】AI智能体记忆系统全解析:从架构形式到功能角色的完整指南
Agentic AI 的背景LLM 最初的产品形态是由 OpenAI 领衔的 ChatBot聊天机器人底层支撑技术是 Transformer 架构大语言模型最初专注于语言文本领域的人工智能应用场景。
LLM ChatBot 现如今已经深刻改变了我们的工作和生活随着 LLM 技术在 toC、toB 应用场景的普及越来越多诸如下列的局限性被发现。
不具有主动性不会主动感知周围环境并且做出反应。
目标意识差在多轮交互过程中可能会忘记最初的目标。
无持续记忆仅仅能够关联有限的非持久化上下文信息。
无法与外部系统交互只能聊天不具有改变周围环境的能力。
Agentic AI代理式人工智能是 LLM 时代的人工智能系统的设计理念与架构范式旨在突破 LLM 的局限性让 LLM 从 “内容生成” 过渡到 “任务执行”。
更进一步的Agentic AI 旨在构建具有自主能力的人工智能系统即能够像人类或生物一样自主感知环境、规划决策、执行行动最终实现特定目标。
自主感知环境Perception能够从各种数据源获取外部环境的信息而不仅仅是聊天窗口。
目标导向Goal-Oriented理解用户意图并设定明确的目标所有行动均围绕目标展开。
规划决策Planning基于自主感知信息和明确目标生成自主迈向目标的一系列计划。
执行行动Action能够操作各种工具操作外部环境执行具体的行动继而改变环境。
环境交互Interaction观察/获取行动后的环境反馈并根据反馈调整后续决策。
自适应循环Loop根据反馈按需形成新一轮的 “规划、执行、观察” 循环最终达到目标。
而 AI Agent人工智能代理则是 Agentic AI 的具体实现。
Agent 是通过传感器感知环境并通过执行器作用于环境的实体。
—— Russell Norvig《人工智能现代方法》2016环境Agent 交互的对象传感器用于观察环境执行器与环境交互的工具LLM决定如何从观察到行动的智能大脑在这里插入图片描述经过了 4 年高速发展之后现如今的 AI Agent 已经成为了探索、挖掘、扩展 LLM 能力边界的重要手段。
同时 LLM 对系统行为的决策控制权也越来越高其 “Agent 特征” 越来越强。
2021 年Prompt Engineering2022 年 10 月ReAct 推理技术2023 年 3 月AutoGPT第一个 Agent2023 年 6 月OpenAI Function Calling2023 年 6 月OpenAI Agent 架构范式2024 年Multi-Agent在这里插入图片描述AI Agent 的发展2021 年Prompt EngineeringPrompt Engineering提示词工程是一种通过精心设计和优化后的 LLM 输入提示词用于引导 LLM 生成高质量且符合预期输出的结果。
Prompt Engineering 能够让 LLM 更清晰理解用户的意图更精确的返回预期的结果。
因此Prompt Engineering 常被人称之为 “魔法咒语”它是一种将人类意图转化为 LLM 执行指令的翻译艺术。
Prompt Engineering 主要研究 System Prompt 和 User Prompt 这两个方向。
LLM 服务提供方会将通用的 Prompt 定义为系统级别的 System Prompt以此来约束 LLM 输入输出的基线。
而用户可以自定义优化的 Prompt 则称为 User Prompt。
让 LLM 更清晰理解用户的意图任务泛化能力不足问题LLM 对复杂问题的理解有难度比如需要多步骤推理才能解决的用户问题。
解决思路使用思维链Chain-of-ThoughtPrompt 来分步引导推理和回答。
在这里插入图片描述让 LLM 返回符合预期的结果输出格式不可控性问题同一问题的不同表述 LLM 可能会输出差异巨大的回答。
解决思路使用设计清晰、结构化的 Prompt 来约束输出范围如格式、语气、长度等。
输出含有偏见与安全性风险问题LLM 可能会输出隐含偏见或有害的回答。
解决思路使用伦理约束 Prompt如以中立立场分析、避免歧视性表述等。
输出幻觉Hallucination问题LLM 会生成虚假信息或编造事实的回答会对业务开展产生严重的影响。
解决思路使用幻觉抑制 Prompt例如明确要求基于已知信息回答、标注不确定内容等。
输出规范化应用示例输出规范化 User Prompt用于确保 LLM 输出的格式符合预期。
角色扮演让 LLM 扮演特定角色如你是一位资深营养师为健身人设计食谱。
参考文本在 Prompt 中提供输出的参考文本如根据以下合同条款回答问题[参考文本]。
样本学习在 Prompt 中提供输入和输出的样本。
格式化输出强制要求以 Markdown、JSON、YAML 等格式输出。
格式化输出示例请从以下会议记录中提取所有待办事项要求
每条任务以 “负责人任务内容截止时间” 格式输出
仅输出事项不添加解释。
若无明确时间则标注 “待确认”。
会议记录[粘贴记录文本]输出可信性应用示例输出可信性 User Prompt用于确保 LLM 输出的结果和观点是可信的。
约束机制如若问题无法回答则返回 “信息不足”。
验证机制例如通过外部搜索的内容对输出的结果进行验证。
容错机制例如多次生成同一个问题的回答并投票选择最佳答案。
交叉验证点在关键步骤插入人工 Checkpoint 检查点。
可解释性增强让 LLM 输出思考逻辑例如“解释你回答的依据”。
精确性增强通过多重解法来确保数值计算是精确的。
可信性示例多重解法对比验证可靠性请用三种不同方法解方程2x 4 10要求
方法1代数移项法
方法2作图法思路
方法3反向验证法完成后检查三种方法结果是否一致若一致输出最终解否则标记矛盾点思维链引导复杂步骤应用示例思维链 User Prompt用于引导 LLM 遵守一系列推理步骤来解决复杂问题。
例如“请逐步推理首先...其次...因此...”。
原子化拆解将复杂问题分解为不可再分的子步骤。
显式占位符用占位符 ___ 命令 LLM 思考作答。
思维链应用示例预测未来 6 个月 AWS EC2 的 CPU/内存用量需求。
基于历史数据制定扩容方案
**数据提取**- 来源CloudWatch指标 → 关键指标名CPUUtilization, MemoryUsage- 时间范围过去3个月粒度按周均值
**趋势计算**- CPU月均增长率本月均值 - 3月前均值/ 3 ___%- 内存使用线性回归y [斜率]x [截距] x为月份
**峰值预留**- 历史峰值CPU___%发生时间___→ 安全余量设置___%- 突发流量容忍是否启用Auto Scaling □是 □否
**实例选型**- 当前配置m
xlarge4vCPU/16GB- 6个月后需求预测CPU __ vCPU, 内存 __ GB → 建议型号_____
**成本优化**- 预留实例覆盖率计算___% → 建议新增预留实例数___- Spot实例适用场景_____如批处理任务2022 年 10 月ReAct 推理技术2022 年 10 月普林斯顿大学与谷歌研究院联合发表了论文《ReAct: Synergizing Reasoning and Acting in Language Models》ReAct在语言模型中协同推理和行动并在论文中提出了突破性的 “Reasoning-Acting 协同框架”讨论了在 LLM 中如何协同 Reasoning 和 Acting即通过 LLM 来影响周围环境。
论文https://arxiv.org/abs/
2
03629代码https://github.com/ysymyth/ReAct该论文指出了通过 LLM 来执行动作并改变环境的新思路为后续 AutoGPT、LangChain 等第一批 AI Agent 系统的诞生奠定了理论基础。
ReAct 最关键的创新在于让 LLM 打破了空间约束使其可以操作现实世界。
ReAct 的核心思想被称为 “三元协同循环”Thought思考分析问题思考实现目标的策略路径。
借鉴思维链推理模式让 LLM 使用自我拆解、自我提问的方式分析问题。
Reason 模块的核心能力是上下文理解、策略规划更重要的是它还能根据反馈的信息对错误内容进行纠正对行为做策略进行调整。
Action行动环境交互根据推理结果调用工具执行操作如 API、数据库、计算器、搜索。
Observation观察获取反馈查看行动结果进入下一轮推理或行动。
核心能力在于结果的收集与分析以及信息的过滤提取。
ReAct 循环推理、行动、观察可以简单理解为控制论在 AI 领域的变体是实现影响外部世界并实现目的的基础。
2023 年 3 月AutoGPT 实验项目AutoGPT 被称为世界上第一个 AI Agent其是一个实验性质项目参考了 ReAct 论文旨在验证 LLM 与外部世界交互的执行能力。
https://github.com/Significant-Gravitas/AutoGPTReAct 三元协同循环设计的具体实现推理调用 ChatGPT。
行动Agent Tools 工具集提供了 Python、浏览器、API 等工具。
观察通过引入缓存单元使其可以根据历史记录自动生成并优化后续的提示词。
在这里插入图片描述2023 年 6 月OpenAI Function Calling2023 年 6 月OpenAI 推出 Function Calling API 功能其借鉴了 ReAct 的 Tools Routing工具路由机制。
ReAct 和 Function Calling 的区别如下图所示。
Function Calling Application 是 ReAct Tools Routing 的具体实现。
该 App 提供 API让用户可以定义自己的 Tools list同时让 LLM 认识用户的 Tools list继而 LLM 可以根据 User Prompt 执行合适的 Function Call即识别何时应该调用 Tools list 中的某个特定 Func 且以结构化的方式传入 parameters。
技术细节参考https://www.cursor-ide.com/blog/openai-function-call-choice2023 年 6 月OpenAI Agent 范式OpenAI Agent 的核心思想依旧来自 ReAct 三元协同循环设计。
区别于 AutoGPT 是一个研究项目OpenAI Agent 是一个面向生产的软件架构范式所以 OpenAI Agent 除了 “规划、行动、观测” 三元协同循环之外还系统性的设计了 Memory记忆体、Planning规划器、Action执行器、Tools工具集四大模块以及它们之间的协作关系进而增加了生产环境所需要的可信输出和 Prompt 子迭代优化的能力。
规划Planning理解输入并将复杂任务拆解为分解分步骤子任务。
拥有思维链、反思、自省、子任务分解等子模块。
其中通过思维链推理模式Agent 能够规划必要的行动步骤。
行动Action Tools是 Agent 执行具体行动并影响外部环境的能力。
将执行器和工具集分离使其更易于扩展。
记忆Memory为 LLM 提供一个外部的记忆存储单元弥补了 LLM 长文本缺陷。
分为短期记忆和长期记忆。
可信输出Memory Reflection可以对输出进行评估约束、验证、容错、解释等操作。
自迭代优化Memory Planning根据历史记录中的输出评估中可以自动优化后续的 Prompt直到通过结果验证为止。
可见OpenAI Agent 框架将任务分解、工具调用、持久存储上下文、结果验证、循环迭代这 5 大能力进行了有机整合。
在这里插入图片描述OpenAI Agent 范式的执行流程LLM理解用户意图Planning规划下一步行动Agent Tools执行具体操作Memory记录历史行为记忆基于 OpenAI Agent 软件架构范式实现的 AI Agent 软件可以具备以下能力使其超越了传统自动化脚本不再依赖固定流程动态迭代规划而具备一定程度的环境适应与智能行为。
更具体的其智能体现在自主性AutonomyAI Agent 可以根据预设的目标自主地规划和执行任务不需要每一步都由人类直接控制。
智能性IntelligenceAI Agent 具备一定的学习、推理、决策和问题解决能力。
反应性与适应性Reactivity AdaptationAI Agent 能够通过各种方式 “感知” 它所处的环境并作出动态响应进而在复杂环境中持续学习和优化自身行为。
在这里插入图片描述2024 年Multi-Agent 范式尽管 OpenAI Agent 架构范式已经在特定场景中取得了突破但在复杂、多步骤或协作场景中的可扩展性仍然受到以下限制继而催生了 Multi-Agent 架构范式。
工具过多可能导致选择复杂上下文变得过于繁琐垂类专业性需求越来越深多业务部门协作业务逻辑困难如下图所示Multi-Agent 则强调多个 Agent 之间的协作每个 Agent 有专属工具集并由一个 Supervisor 负责分发特定任务到 Agent以及协调 Agent 之间的通信。
Multi-Agent 和 Single-Agent 的主要区别如下专业化智能体协作体系Ensemble of Specialized Agents每个 Agent 负责不同功能并通过消息队列、共享内存等方式进行通信。
例如 MetaGPT 采用模拟公司部门如 CEO、CTO、工程师角色的方式构建智能体角色模块化、可复用、职责清晰。
编排层 / 元智能体Orchestration Layers / Meta-AgentsMulti-Agent 的一项关键创新是引入了元智能体用于负责统一编排、协调各子智能体的生命周期、管理依赖关系、分配角色并解决冲突。
这类元智能体通常包含任务管理器、评估器或协调者角色。
例如在 ChatDev 系统中一个 CEO 元智能体将子任务分配给不同的部门智能体并整合它们的输出形成统一的策略响应。
高级推理与规划能力Advanced Reasoning and PlanningMulti-Agent 系统内嵌递归推理机制如 ReAct、思维链、思维树等框架。
这些机制允许智能体将复杂任务分解为多个推理阶段评估中间结果并动态调整行动计划从而提升系统应对不确定性或任务失败的能力。
持久化记忆架构Persistent Memory ArchitecturesMulti-Agent 通过持久记忆系统能够在多个任务周期或 Agents 共享知识。
可见Single-Agent 更适用于单一任务的自动化处理例如智能客服。
而 Multi-Agent 则更接近人类的组织式智能例如多机器人协调系统。
Multi-Agent 的概念因为斯坦福论文 《Generative Agents: Interactive Simulacra of Human Behavior》而被广泛传播。
在论文中研究者构建了一个虚拟小镇 Simulacra并放置了 25 个角色扮演智能体。
https://arxiv.org/abs/
2
03442每个 Agent 都配备了记忆、规划、反思模块并且它们之间共享记忆存储了规划、反思行为以及所有历史事件。
针对任何下一步行动或问题系统会检索记忆并按 “新近度、重要性、相关性” 评分三重权重 Retrieve 记忆检索算法将得分最高的记忆提供给 Agent。
在这里插入图片描述在该虚拟小镇交互实验中得出了以下关键结论如果去掉 “记忆、反思、规划” 中的任意一个功能智能体的行为就会变傻比如反复吃午饭或者记不住刚聊过的事。
这印证了 “观察、规划、反思” 能力对 Agent 的表现非常重要。
缺乏反思的规划是不完整的。
分层记忆架构是行为连贯性的关键。
瞬时记忆存储当前感知所见所闻短期记忆保留近期关键事件如约会长期记忆人格核心信念如我讨厌咖啡。
“LLM 记忆 环境反馈” 智能体能够生成高度拟人行为例如能记住朋友、传播消息比如谁要竞选市长很快全镇都知道了还能形成新的人际关系。
社会关系的涌现机制智能体通过信息交换自主构建社会结构。
Simulacra 虚拟小镇启示了 Multi-Agent 范式在构建 “社会智能体” 方面的潜力Multi-Agent 系统的自主性要高于 Single-Agent能够处理需要复杂协作的任务。
同时 Multi-Agent 之间的信息共享使其能够在更广泛的任务和环境中进行学习和适应。
AI Agent 的核心技术原理记忆LLM 是一个无状态系统不会持久化存储用户数据只会暂存对话上下文称之为 “短期记忆”。
所以 LLM 在多轮对话之后可能会忘记前面对话的内容。
但实际的 Agent 应用中往往需要 LLM 能够追踪数十甚至数百个步骤的执行结果而不仅仅是近期的操作。
所以 Agent 需要辅助提供 “长期记忆” 功能。
分层记忆系统使得 Agent 可以按需存储、调用不同的记忆模块在复杂任务处理中展现出 Human-lke 的持续学习能力。
短期记忆短期记忆可以通过将完整对话历史嵌入打平 Prompt 中进行模拟。
短期记忆的长度与 LLM 的 tokens 长度相关目前先进的 LLM 已经支持了 数十万的 token 长度。
例如Claude Sonnet 4 支持100 万 tokens 上下文长度。
在这里插入图片描述对于特别长的对话历史现在常用 History Summarize 技术让 LLM 自己将对话历史进行
总结压缩。
通过不断地
总结对话可以使对话记录的规模保持较小。
这样既能减少 token 的数量又能只跟踪最重要的信息。
在这里插入图片描述长期记忆Agent 实现长期记忆的常见技术是 “外挂” 向量数据库将所有的对话、行动和结果都持久化的存储起来。
在使用长期记忆时首先根据 User Query 去 Retrieval 向量数据库获取 Relevant Info然后将 Query 和 Relevant Info 进行 Augmented 组合成新的 Prompt最后将 Augmented Prompt 输入到 LLM 中进行 Generate。
这就是 RAG 技术的基本原理。
目前研究者正在根据实际的业务场景将长期记忆细分为多种用途的子类包括语义记忆Semantic Memory存储世界常识向量记忆Vector Memory记录对话历史上下文情景记忆Episodic Memory保存特定事件细节程序性记忆存储操作规则等工具与行动通常的 LLM 本身并不具备 Tool 执行能力所以 Agent 需要提供执行器模块。
但 LLM 可以告诉 Agent 什么时候执行什么 Tool 以及传递什么参数格式例如JSON 或 YAML 等所以 Agent 需要提供 Tool List 给 LLM 结合任务上下文来进行选择。
在这里插入图片描述现今已经有 LLM 开始集成 Tool List 来弥补自身的缺陷例如 LLM 数学运算的精确性问题就可以通过 LLM 内建的数学运算工具来解决。
这也是目前较为火热的 Toolformer 研究方向。
规划推理式 LLM根据推理方式可以将 LLM 的类型分为常规 LLM 和推理式 LLM。
而后者会在正在回答问题之前首先将思考推理的过程和步骤呈现给用户。
显然的推理式 LLM 更适用于 AI Agent 场景而实现推理式 LLM 的方式主要有 2 种使用思维链提示词CoT Prompt引导 LLM 执行推理。
LLM 自身就内建了 “深度思考” 的推理过程。
例如DeepSeek-R1 就通过奖励机制引导模型使用推理过程。
ReAct Prompt在上文中我们已经介绍了 ReAct 范式当 Agent 拥有了 Reasoning LLM 和 ToolsAction 之后就可以实现 ReAct Reasoning Action 模式。
这里我们主要再关注 Agent 使用 ReAct Prompt 作为 System Prompt 激活 LLM ReAct 模式的方式。
激活 LLM ReAct 模式后输入 User Query 才会更准确的进行 “思考-行动-观察” 循环直至某个行动实现目标并返回结果。
ReflectionReflection反思是 Agent 实现 “自迭代优化” 和 “可信输出” 的关键。
没有 LLM 能够完美的执行任务关键是从失败中反思学习并优化行动策略。
目前常见的反思技术有 Reflexion 和 Self-refine 等。
Reflexion 技术指导 Agent 应该包括自定义以下模块执行者Actor由 ReAct 和 CoT 支撑规划和行动。
评估者Evaluator在 Short-term 环境对 Actor 的 Output 进行评分。
反思者Self-reflection结合 Actor 的 Output 和 Actor 的评分进行自我反思决策下一轮的 Prompt 如何优化或退出。
在这里插入图片描述Self-refine 则是通过 LLM 内建智能来进行 “反思”由同一个 LLM 来对 Output 进行 Feedback 和 Refine。
AI Agent 的产品形态和技术流派智能体通用模块通过上文的分析我们知道一个 AI Agent 软件架构需要具备以下通用模块此外根据产品具体的形态不同还会具有各自的特性和模块。
LLM 选择器、连接器根据不同场景选择侧重不同的 LLM 模型进行推理。
规划器和迭代规划器支持 Planning 生成 TODO list支持 Reflect 迭代优化 TODO list。
ActionFunc Calling、Tool Calling 执行器和工具集。
上下文处理器上下文优化、上下文压缩。
记忆模块短期记忆、长期记忆、记忆压缩。
执行环境沙箱、虚拟机等。
在这里插入图片描述ReAct 自主规划智能体通用智能体ReAct 自主规划智能体是实现通用智能体的主要方式如Manus 本身是一个 ReAct 架构的 Agent他的成功在于积累了大量工程实践得出的工具和优秀的上下文工程。
区分定义核心是以目标为导向的动态规划智能体会根据反馈不断调整规划和行动四步法观察、推理、行动、
总结。
特殊模块记忆压缩模块、Plan Loop 模块应用场合问题复杂且执行路径不固定需要大量信息代替人类提示词DeepResearch 智能体典型产品有 Perplexity通过搜索作为 Reference 在知识发现深度研究场景中弥补了 LLM 的幻觉问题。
区分定义强调信息的研究主题整理包括收集、分类、归纳、逻辑化。
但不强调新思路、新方案、新观点。
主要解决快速整理旧数据、旧信息的问题。
特殊模块Reference 搜索器。
可迭代进化智能体典型产品有 Google AlphaEvolve侧重自迭代循环探索人类未知领域的边界。
区分定义是一个能够帮助人类突破知识边界的智能体能够对特性问题提出新思路新方案不断迭代进化。
特殊模块Agent 并发并发解决同一个问题得到不同的答案保证思路的多样性。
评估器在多个 Agent 并发出评估更正确的方向继续进入下一轮并发。
Workflow 流程智能体Workflow 智能体是现如今 toB 智能体落地较好的方式更易于结合企业现有的 SOP 工作流程。
如LangGraph通过不同的图结构来编排 LLM 决策过程从而实现更复杂、更可靠的执行路径。
区分定义开发者人为的对任务进行拆解智能体需要提供任务/流程的灵活编排能力。
需要学习图知识等概念对开发者的能力要求较高才能开发出好用的智能体。
特殊模块全局状态持久化在多个流程节点中进行信息共享例如状态机、变量等。
逻辑控制组件if-else、do-while 循环等逻辑控制。
流程控制组件顺序执行、并行执行、循环执行。
应用场景流程复杂但固定的流程。
从逻辑的角度对比Workflow 是企业信息化转型的提效逻辑而 ReAct 是以目标为导向的问题解决逻辑。
如下图从技术的角度对比Workflow 是一个 Router路由器设计而 ReAct 是 Fully Autonomous自主规划设计Agent 对问题的 Control 掌控力度不同Agent 的自主性程度。
一般而言LLM 对系统行为的决策控制权越高其 “Agent 特征” 就越强。
Multi-Agent 协作智能体Multi-Agent 诞生于 “角色扮演”强调 “人事组织架构” 和 “协作”被寄希望于以此形态构建庞大的 “企业智能系统”。
如CrewAI 是最知名的 Multi-Agent Platform 之一 其设计灵感来自现实世界中的团队分工每个智能体扮演不同的角色分配不同的任务并共享目标。
本质是构建通过 Multi-Agent 的组织形式来构建 AI 团队模拟人类组织分工协作模式。
协调 Agent任务分解与调度类似项目经理专家 Agent垂直领域执行如 Stable Diffusion 绘图 Agent验证 Agent结果可靠性评估区分定义强调多个 Agent 之间的自治、协作和通信。
自治每个 Agent 各自都能够完成特定领域的完整任务。
例如运维智能体、研发智能体。
协作多个 Agent 结合能够完成更复杂的跨领域的完整任务。
例如DevOps 组织架构角色扮演 Multi-Agent 串联多个智能体。
特殊组件投票/决策模块、共享记忆模块、A2A 通讯模块。
应用场景系统庞大部门划分复杂不同部门提供各自的智能体。
但值得注意的是现如今的 Multi-Agent 产品往往容易陷入华而不实的窘境更强调技术而非业务问题的解决。
在很多产品营销中存在为了 Multi 而 Multi 的现象但实际上单一 Agent 能够满足的功能没必要划分为多个 Agent。
AI Agent 面临的关键挑战和解决思路关键问题上述可知ReAct 自主规划智能体是接近 AI Agent 最初定义的形态目标是 “完全自主人工智能”目前主要发布 toC 产品。
区别于 Workflow 流程智能体后者在 toB 领域有更多的落地案例但存在用 “人力智能” 补充 “人工智能” 的客观情况。
造成这种现状的根本原因是 LLM 和 AI Agent 都尚处于高速发展的早期阶段必然存在诸多问题和挑战。
这些问题中一部分是从 LLM 大语言模型继承而来的而另外一部分则是软件工程方面的挑战。
例如缺乏统一的标准架构、通信协议与可验证机制难以进行跨平台集成与通用化开发等。
这里回到 AI Agent 的 “规划、行动、记忆、可信输出、优化循环” 五大方面并围绕这五大方面来归纳出 AI Agent 亟需解决的关键挑战。
私域知识理解能力LLM 默认只具有公域知识但不理解企业内部定义的私域知识导致 LLM 难以理解企业内部场景。
实时数据能力LLM 默认只具有旧知识而 Agent 规划往往需要实时数据。
幻觉抑制能力LLM 幻觉无法保证 Agent 可信输出和优化循环的质量例如在循环规划时同一个问题可能出现完全不同的 2 个规划。
可解析性LLM 推理过程要么黑盒要么太过冗长可解析性差会导致用户质疑推理结果使得结果输出不可信。
无限循环风险Agent 以目标为导向的自优化循环存在无限循环风险这意味着高成本风险。
错误传播Multi-Agent 场景中往往具有复杂的协同路径也会涉及多次 LLM 交互。
存在叠加错误和错误传播的问题例如一件事情可能有 20 多个步骤会放大错误的概率。
解决思路使得 Agent 可实现更符合上下文的行为。
例如Agent 在生成摘要之前会验证检索到的数据。
在 multi-Agent 系统中这种循环对于协作一致性至关重要。
每个 Agent 的观察结果需要与其他 Agent 的输出进行协调。
要实现这一点共享内存和一致的日志记录是关键。
RAG检索增强生成结合 “实时动态数据检索” 和 “私域静态数据库”RAG 能够解决实时数据、私域知识、大模型幻觉等问题。
例如在企业知识库和智能客服场景中RAG 可以确保结果输出基于外部事实。
在 Multi-Agent 系统中RAG 作为共享的 “事实基础”能确保 Agent 之间的一致性并减少因上下文不一致导致的错误传播。
程序化的提示词工程提示词工程的程序化实现可以对 LLM 输入输出进行结构化设计和约束可以为不同的 Agent 类型如规划者、检索者、
总结者根据其功能使用结构化的提示词模版。
集合提示词模版、RAG 等技术可以减少手动调整提示词的不稳定性。
分层记忆架构除了短期记忆、长期记忆还允许每个 Agent 可以维护私有记忆本地内存和公共记忆共享内存从而实现 Agent 的个性化决策和协作性决策。
反思与自我批判引入 “结果验证模块异常重试机制置信度评估模块”强化多轮迭代测试与评估体系。
Agent 在完成任务时可以使用二次推理过程来审查自己的输出从而提高鲁棒性和减少错误率。
这项能力也可以扩展到 Agent 之间的相互评估。
例如一个验证 Agent 可以审计
总结其他 Agent 的工作确保协作质量控制。
监控、审计与可解释性通过记录提示词输入、工具调用、结果输出、推理过程、系统日志等跟踪审计机制继而构建 Agent 的可解析性能力。
设计完善的事实核查与答案校验流程用于对 AI Agents 进行事后分析、性能调整、故障跟踪、优化行为。
对于识别哪个 Agent 导致了错误以及在什么条件下发生错误是十分关键的。
设置人工检查点基于可解析性在关键环节设置人工检查点二次确认引入人机协同机制对低可信度答案增加人工审核功能。
基于角色的 Multi-Agent 编排一方面帮助元智能体更好的完成任务编排和分发继而再角色智能体中进行分隔推理。
另一方面为 AI Agents 引入基于角色的访问控制、沙箱和身份解析以确保 Agent 在其范围内行动并且其决策可以被审计或撤销。
设置预算熔断机制设置最大迭代次数如 max_cycles50避免无限循环。
设置成本监控如 OpenAI 费用警报。
建立企业数据治理机制企业内部数据往往散落在不同系统格式不一质量参差不齐难以获取和整合高质量数据来驱动 AI Agent。
搭建企业级数据治理战略打破数据孤岛。
例如初期建立简单的数据集成、数据清洗数据平台后期可逐步扩大至统一的数据中台或数据湖仓。
Agentic AI 的未来Agentic AI 的终极目标是主动智能Proactive Intelligence不再局限于被动响应而是能自动感知环境自适应环境基于目标主动推理。
Agentic AI 的未来需要 LLM 和 AI Agent 两方面进行突破LLM 长文本LLM 幻觉和可信输出Agent 因果推理和模拟规划Multi-Agent 统一编排、统一通信标准、统一集成架构如MCP、A2A 协议等LLM 伦理治理如何学习AGI大模型作为一名热心肠的互联网老兵我决定把宝贵的AI知识分享给大家。
至于能学习到多少就看你的学习毅力和能力了 。
我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
因篇幅有限仅展示部分资料需要点击下方链接即可前往获取2025最新版CSDN大礼包《AGI大模型学习资源包》免费分享**
2025最新大模型学习路线一个明确的学习路线可以帮助新人了解从哪里开始按照什么顺序学习以及需要掌握哪些知识点。
大模型领域涉及的知识点非常广泛没有明确的学习路线可能会导致新人感到迷茫不知道应该专注于哪些内容。
我们把学习路线分成L1到L4四个阶段一步步带你从入门到进阶从理论到实战。
L1级别:AI大模型时代的华丽登场L1阶段我们会去了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理
关键技术以及大模型应用场景通过理论原理结合多个项目实战从提示工程基础到提示工程进阶掌握Prompt提示工程。
L2级别AI大模型RAG应用开发工程L2阶段是我们的AI大模型RAG应用开发工程我们会去学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。
L3级别大模型Agent应用架构进阶实践L3阶段大模型Agent应用架构进阶实现我们会去学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造我们自己的Agent智能体同时还可以学习到包括Coze、Dify在内的可视化工具的使用。
L4级别大模型微调与私有化部署L4阶段大模型的微调和私有化部署我们会更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。
整个大模型学习路线L1主要是对大模型的理论基础、生态以及提示词他的一个学习掌握而L3 L4更多的是通过项目实战来掌握大模型的应用开发针对以上大模型的学习路线我们也整理了对应的学习视频教程和配套的学习资料。
大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。
书籍含电子版PDF
大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。
大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。
大模型面试题面试不仅是技术的较量更需要充分的准备。
在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。
因篇幅有限仅展示部分资料需要点击下方链接即可前往获取2025最新版CSDN大礼包《AGI大模型学习资源包》免费分享