核心内容摘要
《愁愁愁》:那些年,我们一起追过的青春与烦恼
让AI像人类一样记忆这家公司如何拿下AI竞赛的下半场门票。
前不久LMArena.ai对全球大模型的市场地位变化做了统计后得到了一个有意思的发现自2023年年中起SOTA模型的迭代周期被快速压缩至35天曾经的SOTA模型只要短短5个月就可能跌出Top57个月后连Top10的门槛都摸不到。
但SOTA不断更新的背后模型的确在进步但曾经ChatGPT、Deepseek这样让人眼前一亮的新产品却越来越少技术进步已经进入了不断小修小补却始终难以突破的瓶颈期。
与逐渐偃旗息鼓的模型进化形成鲜明对比的是过去两年多围绕AI记忆形成的你方唱罢我登场的热闹。
其中最先一步出发的是2023年先后涌现出的诸如Milvus、Pinecone、faiss为代表的向量数据库产品。
此后一年建立在成熟的语义、知识图库以及关键词检索基础上2024—2025年期间LettaMemGPT、Mem
MemU、MemOS为代表的各种AI记忆框架如雨后春笋般冒出GitHub上各种Mem“X”系产品多到可以组成连连看。
热闹很快传导至模型玩家阵营一周前Claude被爆要在Cowork中为模型增加记忆能力引发的讨论尚未消退谷歌又紧随其后宣布了最新的Nested Learning成果模型会根据上下文推理的结果自动修改参数实现模型记忆再次引发行业哗然。
而在场景侧代码补全、情感陪伴、智能客服……模型记忆的黄金商业模式市场正诞生出越来越多跑通PMF的细分爆款。
顺着这条线红熊AI在内一些主打AI记忆科学解决方案商业的玩家也随之站到了聚光灯下成为新的行业焦点。
记忆成为新的中场赛点已经无可置疑。
但关于如何给大模型加上记忆如何让模型更好地记忆或许一直以来行业都有三个误解。
误解一记忆RAG长上下文红熊AI创始人温德亮是行业老人了但创业以来每天都要应对投资人与客户的灵魂拷问“你们的竞争对手是谁”问题看似普通但回答起来却会让人陷入两难说没有对手像自大说有对手又找不到真正对标的玩家。
在2023—2024年AIinfra爆发期RAG检索增强生成技术一度成了AI记忆的代名词。
通过给模型外置一个向量数据库并存入各种企业的私有数据、专业文献大模型便能掌握在模型训练阶段没有更新的信息以及私有数据知识。
在那一时期投资人看项目必问RAG性能客户选型必定先比检索准确率仿佛只要叠加上下文窗口、检索优化算法AI健忘的痛点就能被尽数解决。
一时之间全球范围内做RAG框架的、做RAG解决方案的以及更深一步做纯私有化知识库部署的团队如过江之鲫。
飞书、钉钉、企业微信等巨头可以靠着标准化以及数据沉淀做标准化中小团队也能靠着私有化部署啃下一个又一个垂直场景。
但在商业中一个认知的共识程度越高就说明它越正确但也越说明这是个滞后变量。
RAG的思路没有错但也会随着技术的演进而暴露出短板。
2024年开始温德亮发现传统RAG似乎被大家过度神话了。
在落地过程中有时候即使只是最基础的知识库项目RAG也能以各种意想不到的姿势撞墙比如在法律类项目经常会出现大量语义相似但是实际适用范围、判例天差地别的场景。
具体来说法条中有很多决定适用边界的关键细节如合同解除需催告程序等在语义层面权重极低会被整体相似性掩盖此外法律体系的运行不是孤立的文本匹配需要遵循上位法优于下位法、特别法优于一般法、新法优于旧法等等约束但面对类似的冲突条款模型只按语义相似度排序而非优先匹配效力更高的法条就会导致整体理解出现偏差。
更不用说法律场景中检索本身一定是绑定案由、主体、地域等结构化场景信息比如人身损害赔偿相关法条可能与适用于交通事故和医疗纠纷的子条款语义相近但举证责任、赔偿标准截然不同纯语义检索完全无法精准区分适配场景。
难度再升级到了各种客服AI场景即便针对场景做了定制化把embedding、chunking、ranking全部做到尽善尽美RAG方案依然会出现在每天重复回答“XX条款的适用场景是什么”“还款日期如何计算”这类问题时花费不必要的检索成本而当用户跨会话咨询时AI更是像换了个人完全不记得上一轮的沟通细节。
温德亮很快意识到基于语义检索的RAG方案只能解决不到60%的真实需求而客户要的是完整场景化解决方案能够实现一次咨询、终身记忆并且动态更新知识。
RAG作为一种被动的检索工具它的存在就像给AI装了本外置词典能解决不知道的问题却解决不了记不住的核心矛盾。
与此同时在写入侧RAG通常也只能以周为单位做离线的数据更新无法实时动态地写入用户的即时会话内容与关注重点。
在此基础上跨会话记忆丢失、信息无法动态沉淀、不会主动关联经验这些都是RAG的能力盲区。
也是因此在他看来真正的AI记忆必须复刻人脑的工作逻辑能短期记得住长期有常识判断有感情。
具体来说人脑处理信息要经过编码、存储、提取三大环节外界信息会经感觉皮层转化为神经信号由前额叶筛选后传入海马体再与既有知识网络整合最终按重要性存入大脑皮层提取时则由海马体联动对应区域激活记忆。
这是一套动态、实时、可写入可检索的智能系统不仅解决了知道的问题也让“知道”本身内化成为认知与思考逻辑的一部分优化后续的思考、判断与行为。
借鉴这套人脑的记忆思维逻辑红熊AI据此打造了完整的记忆科学体系并在今年1月推出记忆熊v
0.
0把AI记忆拆解为显性记忆、隐性记忆、联想记忆以及动态进化记忆不同层之间通过智能算法动态流转、在不同场合以不同的方式使用。
更关键的是这套体系不止于读、写、存还为记忆本身加入了情感加权、智能遗忘、跨智能体协同等能力从底层重构了AI记忆的逻辑。
如此一来不仅解决了存储数据量爆炸带来成本飙升、上下文过长的问题也为不同的记忆赋予不同的权重从而让记忆的利用变得更加高效。
误解二事实检索重于一切情商才能更好解决问题解决了整体记忆体系架构如何搭建的问题之后红熊AI的核心研发团队和所有技术团队一样开始把准确率当作记忆系统的唯一KPI。
团队里做工程与研发的同事占据多数其中理工背景的男生又占据了大半如此配置最大的优点是大家都有共同话语体系、思维能力强在金融风控、技术运维等场景这套逻辑可以跑得非常顺。
毕竟这些场景中事实优先错一个数字都可能引发无法预知的风险。
但这么做的不足则在于不分场合的过度坦诚与逻辑推理本质上就是冷漠与对抗的代名词。
让所有人意识到这一点的是一个意外的客户需求。
2025年某发达省份妇联找到了红熊AI团队表示他们希望用AI承接深夜情感咨询、家庭纠纷求助。
梳理用户需求时团队很快发现那些深夜的来访者他们的烦恼有时是非常琐碎、具体却没有标准解决答案的甚至用户来访时自己已经有了判断只是需要一点来自外界的肯定与鼓励。
在这种场景中用户不需要也不存在所谓的精准事实答案他们需要的是被理解、被安抚、被肯定。
比如新用户来电时AI要快速识别情绪波动引导他们情绪的宣泄老用户回访时要记得他们上次的困扰以及怎样的安抚最为有效。
总而言之犯错要先道歉情感困扰要先赞同理解共情这些人类处事的情商准则AI落地也同样需要熟练掌握。
这也倒逼红熊AI攻克了记忆系统的情感难题通过给每段记忆贴上情感权重标签可以从多维度量化用户情绪。
比如文本场景中我们可以通过负面/正面词汇密度、句式反问句、感叹句、情绪强度词“极其”“再也不”综合算出
分的情感分数语音场景中则需要叠加语速、语调、停顿、音量特征校准多模态场景还可以再加入面部表情识别让量化更精准。
就如同朋友失恋了我们需要先给对方一个拥抱而不是追根究底分手原因做情感判官。
对AI落地来说情感权重不仅会决定记忆的优先级更影响AI的回应逻辑。
比如在红熊AI的产品中如果用户上个月因物流延迟给出90分负面评价那么这段记忆需要被存入长期记忆并贴上高负面标签。
当用户本月再次询问货什么时候到AI不能只机械回复物流在途而是先安抚“抱歉之前让你等久了我帮你查了实时物流马上就能到”再同步事实信息。
误解三Agent的未来是标准化非标才是行业宿命今年年初Manus的爆火与并购进度一度让整个Agent赛道陷入狂欢。
一时之间复刻下一个Manus做to B的Manus成为了行业最热门的议题。
资本在等待超级Agent的诞生用户也期待用一套产品解决不同场景中的所有问题。
但在大厂打过工又在SaaS公司做过CTO如今在自己创业的温德亮脑海中一直有一个问号agent的****市场盘子的确很大但真的能出现所谓的超级赢家吗或许一个有些扫兴的结论是agent类产品的宿命在革命SaaS但也必须走上SaaS的老路。
革命SaaS的逻辑在于记忆与工具的加持让Agent开发门槛大幅降低从而针对每一个特殊场景提出针对性的解决方案进而瓦解传统SaaS的场景壁垒。
而与这种无限细分的天然优势相伴随的必定是传统中国SaaS的非标碎片化诅咒。
在实际开发中温德亮意识到没有一套标准化记忆系统能适配所有行业甚至同一行业的不同品类都要差异化定制。
哪怕都是电商销售百货卖手机壳的商家和卖手套的商家前者关注材质、图案后者侧重尺码、舒适度关键词不同记忆规则的制定也要有所区别。
到了情商的使用与落地不同行业的情感权重占比更是天差地别。
红熊AI摸索出一套行业规则售后客服、教育场景情感权重占40%—50%必须优先安抚情绪医疗、金融风控场景情商的需求仅占10%—20%事实优先通用陪伴场景占20%—30%贴合心情即可。
这都需要漫长的行业摸索。
在这一背景下红熊AI必须在做好标准化能力的基础上接受在解决方案环节的非标、苦生意的宿命首先是共性能力建设。
尽管不同客户的数据来源、数据处理流程以及对记忆的需求模式不尽相同但行业的长期趋势是多agent协作、大模型将越来越多地利用起企业的多模态数据这却是共同的大趋势。
也是因此在记忆熊v
0.
0中红熊AI强化了其集群化Agent记忆协同能力通过引入统一记忆中枢Memory Hub可以实现多Agent间的最小化、按需式记忆共享解决传统多Agent系统的记忆冗余、冲突问题。
并同时支持主管模式集中管控流水线任务和协作模式去中心化复杂决策适配不同场景的智能体组织形态。
而针对多模态数据的处理需求在知识库层面红熊AI则推出了三大解析引擎DeepDoc深度解析、MinerU智能提取、TextIn快速解析实现100%版面还原支持PPTX高保真解析、音视频以文搜音并通过向量图谱双驱动检索将多跳推理准确率提升至
9
5%。
基于以上共性的能力建设非标的环节则集中于行业词汇库积累、知识图谱打造这样的行业解决方案打造。
红熊AI旗下记忆熊的产品设计结构我们可以理解为产品顶层是一个由小模型不断根据用户输入做动态调整的类似graph的知识图谱结构类似导航图向下则是不同的数据库组成的记忆管理模块。
其中顶层的graph打造是一个需要一个细分行业一个细分行业去硬啃的过程。
首次拓展新的品类客户前期与客户共建做文档以及知识梳理就需要花掉几周的时间此后用户的数据处理也需要消耗整体25%上下的成本。
在这个过程中也需要团队去不断学习与积累不同行业的知识比如医疗行业的负面词不是“不满意”而是“疼痛、过敏、并发症”金融行业的核心词是“平仓、建仓、净值”需优先记忆制造业的“故障、停机”则要强制存入长期记忆。
但另一个角度来看这种前期开拓的非标准化以及缓慢又会成为企业先发优势的由来。
过去十多年中SaaS的成长路径往往遵循一个细分领域拿下灯塔客户沉淀出细分行业解决方案全行业拓展的规律其标准化程度虽然远不及互联网但企业的核心壁垒也正是在于这种细分行业认知的沉淀。
针对不同行业的记忆打造同样如此有了前期解决方案的不断细分才会有后来的生态效应与know how积累。
尾声进入2026年大模型的叙事正从scaling law为核心的参数闪电战切换至记忆为主导的马拉松式下半场。
而在大模型的下半场记忆能力已经成为拉开不同模型不同agent表现的核心来源。
围绕这一套叙事逻辑参与的玩家既有模型厂、框架玩家这样的上游infra玩家也有红熊AI在内这样的专业解决方案商。
这个过程不如曾经的百模大战一样的高举高打也注定不会像百模大战一样快速地决出阶段性的赢家给出所谓的标准答案。
但动物有了个体的记忆才会有更好的生存人类有了族群的记忆才有了文明而记忆之于AI或许正是新一轮产业进化的起点。
学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】