核心内容摘要
跟着来!0基础小白也能学会网络安全!(干货)
在使用 DeepSeek 处理复杂逻辑问题时你是否发现如果直接问答案是多少它往往会一本正经地胡说八道但如果你多加一句请一步步思考它就像突然打通了任督二脉给出了完美的推导过程。
这就是Chain-of-Thought (CoT思维链)的魔力。
它不仅仅是一个提示词技巧更是大模型涌现出的推理能力的核心体现。
它将大模型的System 1直觉快思考强行切换到了System 2逻辑慢思考模式。
CoT 的本质用算力换逻辑大模型LLM本质上是一个基于概率的Next Token Prediction机器。
在生成下一个字时它严重依赖于前面的上下文Context。
直接回答 (Direct Prompting)上下文只有问题。
模型必须从问题直接跳跃到答案。
对于复杂问题如数学证明、代码调试这种单步跳跃的难度极大模型很容易在中间环节“脑补”出错误的中间状态导致幻觉。
CoT 回答上下文包含了问题 推理步骤1 推理步骤2…。
模型在生成最终答案时实际上是在利用前面自己生成的推理步骤作为跳板。
每一个推理步骤都大大降低了生成下一步的熵不确定性。
简单来说CoT 强迫模型把默算变成了打草稿。
虽然消耗了更多的 Token即更多的算力和时间但换来了逻辑的严密性。
这是一种典型的Time-for-Accuracy时间换精度策略。
Zero-Shot CoT一句咒语的魔法最著名的 CoT 技巧莫过于那句神谕Let’s think step by step.让我们一步步思考。
仅需在 Prompt 末尾加上这句话DeepSeek-67B 在 GSM8K小学数学数据集上的准确率就能瞬间提升几十个百分点。
这种方法被称为Zero-Shot CoT。
它不需要你提供任何示例模型会自动激活其内部的逻辑推理回路开始分解问题。
案例对比普通 Prompt问约翰有5个苹果吃了2个买回3个分给朋友一半。
他还剩几个答3个。
错误直接瞎猜Zero-Shot CoT问约翰有5个苹果吃了2个买回3个分给朋友一半。
他还剩几个让我们一步步思考。
答起始有 5 个苹果。
吃了 2 个5 - 2 3 个。
买回 3 个3 3 6 个。
分给朋友一半6 / 2 3 个。
他还剩 3 个。
答案是 3。
正确
Few-Shot CoT照猫画虎的艺术对于格式要求严格或逻辑非常特定的任务如金融报表分析、法律合规审查Zero-Shot 可能不够稳定。
此时Few-Shot CoT提供带推理过程的示例是更优的选择。
通过展示如何拆解问题你实际上是在给模型In-Context Learning上下文编程。
Prompt 模板示例问题杂货店卖苹果每个1元。
买5送1。
我想买20个苹果需要多少钱 答案让我们一步步思考。
买5送1相当于6个苹果是一组。
20除以6等于3组余2个。
每组买5个花费5元。
3组花费 3 * 5 15 元。
剩下的2个每个1元花费2元。
总花费 15 2 17 元。
答案是17元。
问题服务器租用费每小时
5元。
买100小时送20小时。
由于项目延期我总共租用了500小时需要付多少钱 答案模型会模仿上面的推理风格输出让我们一步步思考。
买100送20相当于120小时是一组。
500除以120等于4组余20小时。
…
进阶玩法ReAct 与 ToTReAct (Reason Act)对于需要调用外部工具如计算器、搜索引擎、数据库的任务单纯的 CoT 是不够的。
ReAct 框架引入了Action步骤。
Thought: 用户想知道 DeepSeek 的股价。
我不知道实时数据。
Action: Search(“DeepSeek stock price”)Observation: $
2
5Thought: 现在我知道价格了。
Answer: DeepSeek 当前股价为 $
2
5。
ToT (Tree of Thoughts)人类在思考复杂问题时往往会进行多路径探索如果选A会怎样如果选B会怎样。
ToT 让模型生成多个可能的推理分支并自我评估每个分支的可行性通过广度优先搜索BFS或深度优先搜索DFS找到最优解。
性能与成本的博弈引入 CoT 并非没有代价。
延迟 (Latency)如我们在
10 压力测试实战中所分析的CoT 显著增加了输出的 Token 数量。
对于 DeepSeek 这样的自回归模型生成 100 个 Token 的推理步骤可能需要几秒钟。
这会直接拉高TP99 延迟。
吞吐量 (Throughput)由于 Context 变长KV Cache 的显存占用也会增加可能导致 Batch Size 减小进而降低系统的整体 TPSTokens Per Second。
决策建议高并发/低延迟场景如即时聊天慎用复杂 CoT或者使用蒸馏Distillation技术用 CoT 生成的数据去微调一个小模型让小模型直接输出答案把思维过程内化。
高准确率/离线场景如报表生成、代码审计必须使用 CoT甚至 ToT。
此时准确率是第一指标延迟可以忍受。
6.
总结提示词工程不仅仅是话术它是对模型认知机理的逆向工程。
Zero-Shot CoT是通用的催化剂。
Few-Shot CoT是定制的模具。
ReAct让大脑有了双手。
ToT让思维有了深度。
掌握 CoT你就掌握了打开大模型黑盒逻辑的钥匙。
在微调之前先问问自己我的 Prompt 写对了吗模型是真的不懂还是只是没被正确引导很多时候一个好的思维链价值抵得上 1000 次微调迭代。