影之刃,雷霆之舞:解析雷电将军的“脚法”艺术

核心内容摘要

探索“推特App成人”的隐秘角落,解锁别样社交新体验
丁香五月,情满芳菲:一场关于美好与诗意的邂逅

llsapp:解锁无限可能,开启数字生活新篇章

文章介绍了Agent模型中的思维链技术不同大模型虽有不同名称但核心原理一致将思考内容带入上下文提升多步推理稳定性。

相比Chatbot场景Agent需要保留每轮工具调用的思考内容避免推理偏差。

模型原生支持优于工程实现部分模型还采用签名校验或加密保护思考内容是Agent多步骤推理的

关键技术。

关于 Agent 模型的思维链之前被几个高大上的词绕晕了claude 提出 Interleaved Thinking交错思维链MiniMax M2 用了同样的概念K2 叫 Thinking-in-ToolsDeepseek V

2 写的是 Thinking in Tool-Usegemini 则是 Thought Signature思考签名。

了解了下概念上比较简单基本是一个东西就是定义了模型思考的内容怎样在 Agent 长上下文里传递。

是什么在25年年初 DeepSeek 的轰炸下思考模型大家都很熟悉了在 Chatbot 单轮对话中模型会先输出思考的内容再输出正文。

再早的 GPT-o1 也一样只不过 o1 不把完整的思考内容输出。

在 Chatbot 进行多轮对话时每一次思考的内容是不会再带入上下文的。

每次到下一轮时思考的内容都会被丢弃只有用户 prompt 和模型回答的正式内容会加到上下文。

因为在普通对话的场景下没必要更倾向于单轮对话解决问题长上下文会干扰模型也会增加 token 消耗。

这些思考模型用到 Agent 上就是下图这样每次模型输出工具调用同时都会输出思考内容思考应该调什么工具为什么调但下次这个思考内容会被丢弃不会带入上下文Agent 的 loop 是用户输入 → 模型输出工具调用 → 调用工具得出结果 → 模型输入下一步工具调用 → 调用工具得出结果 → …. 直到任务完成或需要用户新的输入。

这不利于模型进行多轮长链路的推理于是 claude 4 sonnet 提出把 thinking 内容带入上下文这个事内化到模型以提升 Agent 性能上下文的组织变成了这样就这样一个事称为 Interleaved Thinking其他的叫法也都是一样的原理。

为什么要带 thinking面向 Chatbot 的模型倾向于一次性解决问题尽量在一次 thinking 后一次输出解决问题。

Agent 相反倾向于多步不断跟环境(tool和user)交互解决问题。

Agent 解决一个复杂问题可能要长达几十轮工具调用如果模型对每次调用工具的思考内容都抛弃只留下结果模型每次都要重新思考每一轮为什么要调这个工具接下来应该调什么工具。

这里每一次的重新思考如果跟原来的思考推理有偏移最终的结果就会有很大的出入和不稳定这种偏移在多轮下几乎一定会发生。

如果每一轮调用的思考内容都放回上下文里每次为什么调工具的推理逻辑上下文都有思维链完整就大大减少了模型对整个规划的理解难度和对下一步的调用计划的偏差。

有没有带 thinking 内容对效果有多大差别MiniMax-M2提供了他们的数据在像 Tau 这种机票预订和电商零售场景的任务 benchmark 提升非常明显这类任务我理解需要操作的步数更多比如搜索机票→筛选过滤→看详情→下单→支付模型在每一步对齐前面的思路很重要同一个工具调用可能的理由随机性更大每一步的思考逻辑带上后更稳定。

工程也能做这么一个简单的事不用模型支持直接工程上拼一下给模型是不是也一样比如手动把思考内容包在一个标签()里伪装成 User Message 或 ToolResult 的一部分放在里面也能达到保留思考的效果。

很多人应该这样做过但跟模型原生支持还是有较大差别。

工程手动拼接模型只会认为这部分仍是用户输入而且模型的训练数据和流程没有这种类型的用户输入和拼接效果只靠模型通用智能随意发挥。

模型原生支持训练时就可以针对这样规范的上下文训练有标注大量的包含思考过程的trajectory轨迹数据训练响应的稳定性必然会提升这也是 Agent 模型的重点优化点之一。

签名上述工具调用的 thinking 内容带到下一轮上下文不同的模型做了不同额外的处理主要是加了不同程度的签名有两种thinking 内容原文带签名校验claude 和 gemini 都为 thinking 的内容加了签名校验带到下一轮时模型会前置判断思考内容有没有被篡改。

为什么要防 thinking 内容被篡改毕竟 prompt 也可以随便改同样是上下文的 thinking 内容改下也没什么。

主要应该是篡改了模型的 thinking 内容会打乱模型的思路让效果变差这也是需要避免的。

另外模型在训练和对齐时已经默认 thinking 是模型自己的输出不是用户随意的输入这是两个不同类型的数据如果实际使用时变成跟Prompt一样可随意篡改可能有未知的安全问题。

不过国内模型目前没看到有加这个签名校验的。

thinking 内容加密claude 在一些情况下不会输出自然语言的 thinking 内容而是包在redacted_thinking里是一串加密后的数据。

而 gemini

5/

0 的 Agent 思维链没有明文的 thinking 字段而是 thought_signature也是一串加密后的数据。

用这种加密的非自然语言数据一个好处是它可以是对模型内部更友好、压缩率更大的数据表述方式也可以在一些涉及安审的场景下内容不泄露给用户。

更重要的还是防泄漏这就跟最开始 GPT o1 不输出所有思考内容一样主要是为了不暴露思考过程模型发布后不会太轻易被蒸馏。

最后目前 claude 4 sonnet、gemini 3 在 Agent 工具调用的场景下都强制要求带工具调用的思考内容和签名这个链路正常是能很大程度提升整体的推理执行效果是 Agent 多步骤推理的必需品。

但目前 Agent 模型的稳定性还是个问题例如在某些场景下业务逻辑明确需要下一步应该调工具 A但模型思考后可能就是会概率性的调工具B在以前是可以直接 hack 替换调工具调用或手动插入其他工具调用没有副作用。

但在思维链这套机制下比较麻烦因为没法替模型输出这个工具调用的思考内容一旦打破这个链对后续推理的效果和稳定性都会有影响。

可能模型厂商后续可以出个允许上层纠错的机制例如可以在某个实际告诉函数工具选择错误重新思考原生支持弥补模型难以保障稳定的不足。

最后唠两句为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选很简单这些岗位缺人且高薪智联招聘的最新数据给出了最直观的印证2025年2月AI领域求职人数同比增幅突破200% 远超其他行业平均水平整个人工智能行业的求职增速达到

3

4%位居各行业榜首其中人工智能工程师岗位的求职热度更是飙升

6

6%。

AI产业的快速扩张也让人才供需矛盾愈发突出。

麦肯锡报告明确预测到2030年中国AI专业人才需求将达600万人人才缺口可能高达400万人这一缺口不仅存在于核心技术领域更蔓延至产业应用的各个环节。

那0基础普通人如何学习大模型 深耕科技一线十二载亲历技术浪潮变迁。

我见证那些率先拥抱AI的同行如何建立起效率与薪资的代际优势。

如今我将积累的大模型面试真题、独家资料、技术报告与实战路线系统整理分享于此为你扫清学习困惑共赴AI时代新程。

我整理出这套 AI 大模型突围资料包【允许白嫖】✅从入门到精通的全套视频教程✅AI大模型学习路线图0基础到项目实战仅需90天✅大模型书籍与技术文档PDF✅各大厂大模型面试题目详解✅640套AI大模型报告合集✅大模型入门实战训练这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】①从入门到精通的全套视频教程包含提示词工程、RAG、Agent等技术点② AI大模型学习路线图0基础到项目实战仅需90天全过程AI大模型学习路线③学习电子书籍和技术文档市面上的大模型书籍确实太多了这些是我精选出来的④各大厂大模型面试题目详解⑤640套AI大模型报告合集⑥大模型入门实战训练如果说你是以下人群中的其中一类都可以来智泊AI学习人工智能找到高薪工作一次小小的“投资”换来的是终身受益应届毕业生‌无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。

零基础转型‌非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界‌。

业务赋能 ‌突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型‌。

获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】

gtv安装包免费下载-gtv安装包免费下载应用

百度百家号客服电话人工服务

123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123