Agent Infra 架构范式,最好的 Agent 框架,也许是“没有”框架

核心内容摘要

Python xlwings与WPS兼容性实战:解决AttributeError ‘NoneType‘ object has no attribute ‘apps‘
通义千问3-Reranker-0.6B网络架构:深入解析模型连接机制

5个步骤教你实现极米投影仪智能家居设备集成

随着AI Agent的应用场景不断拓宽从日常对话助手到复杂业务自动化工具智能体需要应对的任务难度、对话历史长度也在持续提升。

但大语言模型LLM与生俱来的上下文窗口限制、居高不下的Token消耗成本以及如何让AI精准“记住”用户偏好、历史交互细节等核心难题正成为阻碍实用型AI Agent落地的关键壁垒。

而记忆系统Memory System作为针对性解决方案已然成为构建高智能、高适配性AI Agent的核心技术支柱也是小白入门大模型、程序员深耕AI Agent开发的必备知识点。

这套记忆系统赋予了AI Agent类人的记忆能力彻底打破了传统AI“对话即忘”的局限既能在单次对话中维持上下文的连贯性精准衔接每一轮交互这就是短期记忆又能跨会话沉淀用户偏好、交互历史与领域专属知识这就是长期记忆。

这种双向记忆能力不仅大幅提升了用户体验的连续性与个性化程度更为程序员打造更智能、更实用的AI应用为小白理解大模型进阶逻辑奠定了坚实基础。

记忆系统基础概念解析一记忆的定义与核心分类对 AI Agent 而言记忆是其实现历史交互回溯、反馈学习与用户偏好适配的核心能力主要分为两个层面会话级记忆短期记忆特指用户与 AI Agent 在单次会话中的多轮交互数据包括用户查询、Agent 响应、工具调用及执行结果等直接服务于当前会话的实时交互。

跨会话记忆长期记忆从多次会话中抽取提炼的通用信息涵盖用户偏好、核心事实、领域经验等能够跨会话辅助 Agent 进行个性化推理。

需要注意的是短期记忆与长期记忆并非单纯以时间维度划分核心区别在于是否能够跨 Session 复用。

两者存在双向交互关系长期记忆从短期记忆中提取有效信息不断迭代更新同时又会反作用于短期记忆为模型提供个性化推理支持。

二主流 Agent 框架的记忆定义对比尽管各主流框架对记忆的命名存在差异但均遵循 “会话级 跨会话级” 的二元划分逻辑具体对比如下框架会话级记忆跨会话记忆核心备注Google ADKSessionMemoryLong-Term Knowledge长期记忆作为可搜索的独立知识库LangChainShort-term memoryLong-term memory长期记忆属于高阶辅助组件非核心基础模块AgentScopeMemoryLongTermMemoryAPI 层面分为两个独立组件功能边界清晰各框架核心说明Google ADKSession 代表单次持续交互过程Memory 则存储来自多次对话的长期知识支持检索调用LangChain短期记忆用于单线程对话的历史回溯长期记忆更偏向 “个人知识库” 性质的外挂组件AgentScope虽以需求驱动为设计理念但在 API 层面明确区分短期记忆与长期记忆组件功能实现互不干扰。

Agent 框架集成记忆系统的通用架构不同 Agent 框架在记忆系统的具体实现上存在细节差异但均遵循统一的核心架构模式理解这一模式有助于高效设计与落地记忆系统。

一通用集成流程Agent 框架集成记忆系统的核心流程可概括为四步推理前加载根据当前用户查询从长期记忆中检索相关关联信息上下文注入将检索到的长期记忆信息融入当前短期记忆为模型推理提供上下文支撑记忆更新推理完成后将短期记忆中的有效信息提炼并写入长期记忆信息处理长期记忆模块通过 LLM 结合向量化模型完成信息的提取、存储与检索优化。

这一流程形成了 “短期记忆 - 长期记忆” 的闭环交互短期记忆实时承接会话数据长期记忆沉淀通用知识两者协同保障 Agent 的交互连贯性与个性化能力。

二短期记忆Session核心特性短期记忆的核心作用是存储当前会话的全量交互数据其关键特性包括存储内容涵盖用户输入、模型回复、工具调用请求及执行结果等会话相关数据参与方式直接作为 LLM 的输入上下文参与实时推理过程更新机制每一轮交互都会新增或更新数据保持实时性核心限制受 LLM 的 maxToken 约束超出限制时需通过上下文工程策略处理。

三长期记忆跨会话核心特性与实现长期记忆与短期记忆形成双向互动机制同时具备独立的技术实现逻辑

与短期记忆的双向交互Record写入从短期记忆的会话数据中提取 “用户偏好、核心事实、任务经验” 等有效信息通过 LLM 进行语义理解与抽取后存储至长期记忆Retrieve检索基于当前用户查询的语义特征从长期记忆中检索相关信息注入短期记忆以辅助模型实现个性化推理。

实践实现方式长期记忆在实际开发中通常以独立第三方组件形式存在因其涉及信息提取、向量化、存储、检索等复杂流程。

主流长期记忆组件包括 Mem

Zep、Memos、ReMe 等这些组件均提供完整的 Record 与 Retrieve 能力Agent 框架可通过 API 快速集成。

信息组织维度长期记忆的信息组织主要分为两大维度满足不同场景需求用户维度个人记忆以用户为核心构建实时更新的个人知识库可支撑用户画像分析、个性化推荐等场景在处理具体任务时按需加载至短期记忆业务领域维度沉淀领域经验与工具使用经验既可以纳入领域知识库也可通过强化学习微调的方式融入模型提升 Agent 在特定领域的专业能力。

短期记忆的上下文工程策略短期记忆直接参与 Agent 与 LLM 的交互过程随着对话长度增加必然面临 Token 超限与成本激增的问题。

上下文工程策略的核心目标是通过智能化处理在保障信息完整性的前提下有效控制上下文规模。

一核心挑战与目标核心挑战长对话场景下短期记忆数据量易超出模型上下文窗口限制导致信息丢失或 Token 成本过高核心目标智能控制上下文大小在减少 Token 消耗的同时保持关键信息完整确保 Agent 高效理解与响应。

二三大核心处理策略上下文工程针对短期记忆的处理策略主要包括缩减、卸载与隔离三类各类策略的适用场景与实现逻辑如下

缩减Reduction有损压缩提炼核心通过摘要、过滤等方式减少信息体量保留核心要点去除冗余细节属于 “有损压缩” 策略。

具体实现包括两种方式预览保留对大块文本内容仅保留前 N 个字符或关键片段作为预览移除原始完整内容

总结摘要利用 LLM 对整段内容进行概括

总结提取核心信息丢弃次要细节。

该策略的核心优势是能快速降低 Token 消耗但需在信息压缩率与完整性之间寻找平衡。

卸载Offloading无损存储按需检索将短期记忆中的完整内容转移至外部存储如文件系统、数据库等仅在上下文中保留引用指针如文件路径、UUID 等需要时通过指针检索恢复完整信息。

适用场景网页搜索结果、超长工具输出、临时计划等占用大量 Token 的内容核心优势上下文保持简洁Token 消耗低且信息无丢失支持按需恢复使用。

隔离Isolation模块化拆分降低负载通过多智能体架构将复杂任务拆分至多个子智能体实现上下文隔离避免不同任务的信息交叉污染同时降低单个 Agent 的上下文负载。

适用场景任务指令清晰简短、仅关注最终输出结果的场景如代码库中搜索特定片段核心优势单个 Agent 的上下文规模小计算开销低执行效率高。

三策略选择三大原则选择上下文处理策略时需基于以下三个核心维度综合判断时间远近优先保留近期消息确保当前对话的即时响应性与相关性历史消息可优先采用缩减或卸载策略数据类型根据消息类型用户输入、工具结果、系统指令等区分优先级重要类型如用户核心需求、系统关键指令优先完整保留信息可恢复性需要完整追溯的信息优先采用卸载策略可恢复对完整性要求低的信息可采用缩减策略有损压缩。

四主流框架的实现方式对比各框架均内置了上下文处理策略支持通过参数化配置实现个性化适配

Google ADK通过 events_compaction_config 独立配置上下文处理策略与 Session 数据存储解耦from google.adk.apps.app import App, EventsCompactionConfig app App( namemy-agent, root_agentroot_agent, events_compaction_configEventsCompactionConfig( compaction_interval3, # 每3次新调用触发一次压缩 overlap_size1 # 保留前一个窗口的最后一次调用信息 ), )

LangChain通过中间件SummarizationMiddleware设置上下文处理参数独立于短期记忆存储from langchain.agents import create_agent from langchain.agents.middleware import SummarizationMiddleware agent create_agent( modelgpt-4o, tools[...], middleware[ SummarizationMiddleware( modelgpt-4o-mini, max_tokens_before_summary4000, # 累计4000 Token时触发摘要 messages_to_keep20, # 摘要后保留最后20条消息 ), ], )

AgentScope通过 AutoContextMemory 实现智能化上下文处理直接集成 Memory 接口无需额外配置AutoContextMemory memory new AutoContextMemory( AutoContextConfig.builder() .msgThreshold(

.maxToken(128 *

.tokenRatio(

0.

.build(), model ); ReActAgent agent ReActAgent.builder() .name(Assistant) .model(model) .memory(memory) .build();与其他框架相比AgentScope 的核心优势在于提供 6 种渐进式压缩策略从轻度到重度覆盖不同场景直接实现 Memory 接口与 Agent 构建流程无缝集成支持工作内存、原始内存、卸载上下文、压缩事件四层存储保障历史可追溯性。

长期记忆技术架构及框架集成长期记忆需满足跨会话持久化存储、高效检索与动态更新的需求其技术架构涵盖多个核心组件与关键流程同时需明确与相关技术的边界差异。

一核心技术组件长期记忆系统围绕 Record记录与 Retrieve检索两大核心流程包含以下关键组件LLM 大模型负责短期记忆中有效信息的语义理解、抽取、决策与生成Embedder 向量化模型将文本信息转换为语义向量为相似性计算提供支持VectorStore 向量数据库持久化存储记忆向量及相关元数据支持高效语义检索GraphStore 图数据库存储实体 - 关系知识图谱辅助复杂关系推理Reranker重排序器对初步检索结果按语义相关性重新排序提升检索精度SQLite记录所有记忆操作的审计日志支持版本回溯与问题排查。

二Record Retrieve 核心流程

Record记录流程LLM 事实提取 → 信息向量化 → 向量存储 →复杂关系存储至图数据库→ SQLite 操作日志记录该流程的核心是从短期记忆中筛选有价值的信息通过标准化处理后实现长期存储确保信息的可复用性。

Retrieve检索流程User query 向量化 → 向量数据库语义检索 → 图数据库关系补充 →Reranker 重排序/LLM 优化→ 结果返回检索流程的核心是快速定位与当前查询高度相关的长期记忆信息为短期记忆提供精准补充。

三长期记忆与 RAG 的核心差异长期记忆系统如 Mem0与 RAG检索增强生成在技术架构上存在相似点但在功能定位与应用场景上差异显著对比维度RAG长期记忆主要目的弥补 LLM 训练数据的时效性、专业性不足提供外部知识支撑记录特定用户的历史交互信息实现个性化、跨会话连续服务服务对象全体用户或通用任务特定用户或会话主体高度个性化知识来源结构化 / 非结构化文档PDF、网页、数据库等用户与 Agent 的对话历史、行为日志等交互数据技术相似点均采用向量化存储通过 Embedding 模型将文本转换为向量存入向量数据库依赖相似性检索用户查询时通过向量化对比检索相关信息上下文注入机制将检索结果融入模型交互上下文辅助 LLM 生成回答。

四核心挑战与解决方案方向长期记忆系统在实际应用中面临三大核心挑战需针对性设计解决方案

准确性挑战核心层面包括记忆管理的有效性巩固、更新、遗忘机制与检索结果的相关性解决方向优化用户画像建模算法提升信息提取精度改进向量化检索与重排序技术增强检索相关性。

安全与隐私挑战核心风险长期记忆存储大量用户隐私信息易面临数据泄露、恶意注入等安全威胁解决方向建立数据加密与严格的访问控制机制防范恶意数据注入攻击构建透明的数据管理体系保障用户对自身数据的掌控权。

多模态记忆支持挑战当前问题文本、视觉、语音等多模态信息仍处于孤立处理状态缺乏统一的记忆空间解决方向研发跨模态关联与检索技术构建统一的多模态记忆表示方法优化存储与检索性能实现毫秒级响应。

五主流框架集成实践以 AgentScope 为例常见的长期记忆组件集成方式如下

集成 Mem0开源主流方案Mem0 是开源长期记忆框架的事实标准集成示例// 初始化 Mem0 长期记忆 Mem0LongTermMemory mem0Memory new Mem0LongTermMemory( Mem0Config.builder() .apiKey(your-mem0-api-key) .build() ); // 创建 Agent 并集成记忆系统 ReActAgent agent ReActAgent.builder() .name(Assistant) .model(model) .memory(memory) // 短期记忆 .longTermMemory(mem0Memory) // 长期记忆 .build();

集成 ReMeAgentScope 官方方案ReMe 与 AgentScope 深度集成支持用户级记忆隔离集成示例// 初始化 ReMe 长期记忆 ReMeLongTermMemory remeMemory ReMeLongTermMemory.builder() .userId(user

// 用户ID实现记忆隔离 .apiBaseUrl(http://localhost:

// ReMe 服务地址 .build(); // 创建 Agent 并集成记忆系统 ReActAgent agent ReActAgent.builder() .name(Assistant) .model(model) .memory(memory) // 短期记忆 .longTermMemory(remeMemory) // 长期记忆 .longTermMemoryMode(LongTermMemoryMode.BOTH) // 双向交互模式 .build();

行业发展趋势与开源产品对比一AI 记忆系统发展核心趋势AI 记忆系统正从研究原型向生产级系统演进从单一技术向综合解决方案发展核心趋势可概括为以下四大方向

核心发展脉络趋势维度核心特点代表技术与系统类脑计算借鉴人脑记忆机制构建分层、动态的记忆架构EverMemOS 四层架构、Google Nested Learning多模态融合整合文本、图像、音频等多源信息形成统一世界记忆多模态智能体、跨模态检索与融合技术工程化与系统化从原型走向稳定、可扩展的生产级系统EverMemOS、Mem

O-Mem智能体能力强化记忆成为智能体长期一致性、主动性与自我演化的基础复杂任务智能体对话、游戏、科研等

2.

关键技术趋势记忆即服务Memory-as-a-Service, MaaS记忆系统将成为 AI 应用的核心基础设施类似传统软件中的数据库提供标准化接口、可扩展存储与高效检索能力精细化记忆管理借鉴人脑记忆全生命周期管理机制结合 LLM 驱动提取、向量化存储、图数据库补充等技术实现记忆的巩固、强化与遗忘多模态记忆系统适配多模态大模型发展突破单一文本记忆限制实现跨模态信息的关联存储与快速检索参数化记忆在 Transformer 架构中引入可学习的记忆单元如 Memory Adapter实现模型层面原生支持用户级记忆但需解决 “灾难性遗忘” 与更新成本高的问题。

主流技术路径当前长期记忆系统的技术路径主要分为两类外部记忆增强主流方案通过向量数据库等外部存储记录历史信息检索后注入当前对话灵活高效检索准确性是关键参数化记忆深度内化将知识编码进模型参数如微调、知识编辑响应速度快但面临 “灾难性遗忘” 与高更新成本挑战。

二主流开源产品对比产品开源时间支持记忆类型LLM 核心作用向量数据库支持图数据库支持Mem02023 年 7 月用户画像 领域记忆记忆创建 / 更新 / 检索支持 pgvector、Neo4j、Memgraph、Qdrant 等支持Zep2023 年初用户画像 领域记忆记忆提取 实体识别支持时序知识图谱架构MemOS2025 年 7 月用户画像 领域记忆记忆提取 推理可选支持非必需支持 NebulaGraph、Neo4jMemobase2025 年 1 月用户画像记忆 领域记忆画像理解 更新不依赖不依赖AgentScope ReMe2025 年 6 月用户画像 领域记忆记忆管理 优化支持 Chroma、Qdrant 等未明确提及从行业评测与社区活跃度来看Mem0 目前处于长期记忆产品的领先地位成为多数场景下的基准选择。

结语记忆系统作为 AI Agent 的核心基础设施其技术成熟度直接决定了智能体的交互体验与智能水平。

当前各框架内置的上下文处理策略压缩、卸载、摘要等已能满足 80%-90% 的通用场景需求但在医疗、法律、金融等专业领域仍需基于通用策略进行针对性优化包括精细化的压缩算法与 Prompt 设计。

长期来看长期记忆系统将朝着更贴近人脑记忆模式的方向演进实现记忆全生命周期的智能管理巩固、强化、遗忘。

同时以云服务模式提供的 “记忆即服务MaaS” 将成为主流形态为各类 AI Agent 应用提供标准化、可扩展的记忆支撑推动智能体向更高阶的自主智能演进。

如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。

但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。

这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。

我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。

那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我们整理出这套AI 大模型突围资料包✅ 从零到一的 AI 学习路径图✅ 大模型调优实战手册附医疗/金融等大厂真实案例✅ 百度/阿里专家闭门录播课✅ 大模型当下最新行业报告✅ 真实大厂面试真题✅ 2025 最新岗位需求图谱所有资料 ⚡️ 朋友们如果有需要《AI大模型入门进阶学习资源包》下方扫码获取~① 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点② 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。

正确的学习路线可以为你节省时间少走弯路方向不对努力白费。

这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通③ 大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。

在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。

以上资料如何领取为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有

年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。

风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。

本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。

以上全套大模型资料如何领取

9·1直接打开-9·1直接打开应用

百度百家号客服电话人工服务

123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123