核心内容摘要
猫娘翻白眼流口水流眼泪:那些让人又爱又怜的瞬间
文章介绍AI Agent开发从提示词工程向模块化、工程化封装的转变。
重点解析Agent Skills的渐进式披露机制解决上下文瓶颈对比Skills与MCP的适用边界并提出混合策略详解Superpowers的TDD工作流方法论和Planning with Files的三文件模式。
最后提供开发高质量Skills的实战建议与工程原则推动AI应用开发从手工作坊走向工业化组装。
在 AI Agent 的演进中我们正经历从简单的提示词工程向模块化、工程化能力封装的范式转变。
Anthropic 推出的Agent Skills以及社区衍生出的Superpowers工作流系统为构建复杂、可靠的 Agent 提供了全新的解决方案。
本文将深入解析 Agent Skills 的核心架构、Superpowers 的 TDD 工作流方法论、Planning with Files 的上下文管理机制并详细对比 Skills 与 MCP 的适用边界与混合策略。
Agent Skills打破上下文瓶颈的模块化架构在构建复杂 Agent 时开发者面临的核心矛盾是上下文窗口的有限性与知识无限性之间的冲突。
为了让 Agent 学会特定任务塞入大量 Prompt 会迅速消耗 Token导致“上下文污染”Context Rot。
Agent Skills应运而生。
它不是又一套 Prompt 模板而是一种标准化的能力封装机制。
1 解剖一个 Skill从工程视角看一个 Skill 是一个遵循特定协议的文件夹包含三个核心部分入口与元数据 (SKILL.md)这是 Skill 的“大脑”采用YAML FrontmatterMarkdown Body结构。
YAML 定义了name和description触发逻辑Markdown Body 定义了具体的执行指令。
执行层 (scripts/)存放 Python、Bash 或 Node.js 脚本。
这些脚本是自包含的通过工具调用协议执行确保沙箱隔离。
知识层 (resources/)存放静态资源模板、PDF、规则说明默认不加载仅在需要时引用。
2 渐进式披露机制 (Progressive Disclosure)Agent Skills 解决了 Token 效率问题其核心在于按需加载Level 1索引扫描Agent 启动时仅读取所有 Skills 的YAML Frontmatter。
这只需极少 Token让 Agent 知道自己“会什么”。
Level 2指令注入 (Instruction Loading)当用户 Prompt 触发某个 Skill 的description时系统才将Markdown Body注入当前上下文。
Level 3动态执行执行过程中若需查阅文档或运行脚本才进一步加载resources/或调用scripts/。
这种机制使得 Agent 可以挂载成百上千个 Skills而不会撑爆上下文窗口。
3 源码视角宿主如何把 Skill 变成“可路由的工具”概念层面讲“渐进式披露”很容易但真正落地要解决三个工程问题怎么从SKILL.md抽元数据、怎么让模型在多技能里做选择、怎么避免每轮交互都加载长文档。
以开源 Agent 宿主如 Cherry Studio的实现为例典型做法是
元数据提取只解析 Frontmatter不吞全文解析入口安装/扫描阶段通过类似parseSkillMetadata的函数读取SKILL.md提取name、description等字段生成结构化PluginMetadata。
语义边界对于 Skill“文件名”语义往往是文件夹名而非.md文件名这样一个 Skill 可以带resources/、scripts/等附件而不是被限制成单文件。
元数据缓存把“技能索引”持久化避免重复解析缓存介质将解析后的 Skill 元数据写入 Agent 工作目录下的缓存文件例如.claude/plugins.json而不是只放在内存里。
读取路径后续每次获取 Agent 信息或进入对话时优先从缓存文件读取已安装插件列表解析失败则降级为空列表但不中断运行。
工具化注入模型看到的是“技能菜单”不是技能全文映射方式Skill 在宿主里会被映射为一种工具类型例如AgentToolsType.Skill并被统一纳入 MCP 工具列表。
注入粒度宿主将name/description/参数结构等信息拼装成工具定义注入 System Prompt模型在每一轮对话里看到的是可用工具集合并基于描述做路由决策。
调用时再展开把长文档留到真正需要的那一刻触发点当模型决定调用某个 Skill工具调用里带上command等参数时宿主才会进入对应的执行/渲染链路。
展开策略此时才按需读取更重的内容可能是SKILL.md的 Body、引用的resources/或直接执行scripts/把“信息”从默认上下文挪到按需读取与可执行资产上。
Skills vs. MCP静态指导与动态执行的博弈理解 Skills 的关键在于厘清它与 MCP 的边界。
Skills解决“怎么做”How-to提供流程指导、最佳实践和思维框架。
MCP解决“有什么”What连接外部工具、数据库和实时数据源。
1 效率与场景对比根据量化分析Skills 与 MCP 在 Token 成本和延迟上存在显著差异Token 成本Skills 通常需要加载文档
tokens 理解
tokens而 MCP 仅需工具描述
tokens。
Skills 的 Token 消耗是 MCP 的
倍。
延迟Skills 需要文档加载和阅读理解过程延迟通常是 MCP 的
1.
倍。
基于此我们可以得出明确的选择原则场景类型推荐方案原因实时数据查询MCPSkills 是静态文档无法获取实时状态MCP 直接连接数据源。
高频简单操作MCP简单操作如文件读写无需复杂指导Skills 会造成 Token 浪费。
复杂计算MCP解释执行代码容易出错MCP 可调用原生优化代码如 C 图像处理。
状态保持操作MCPSkills 无状态MCP 工具可维护会话级状态如断点续传。
工作流指导Skills固化最佳实践、多步骤决策流程AI 需要理解“为什么”做。
2 最佳实践混合策略最强大的 Agent 往往是 Skills 与 MCP 的组合Skills作为“指挥官”负责流程编排和策略制定。
MCP作为“执行官”负责具体操作和数据获取。
例如在systematic-debuggingSkill 中Agent 遵循 Skill 定义的“根因分析 - 假设验证”流程但在执行每一步时调用query_logs或run_test等 MCP 工具。
SuperpowersTDD 驱动的 Agent 工作流系统Superpowers Skills 是一套经过实战验证的高级 Agent 工作流系统其核心理念是将测试驱动开发TDD应用于 Prompt 和文档编写。
1 编写技能的方法论编写技能 将 TDD 应用于流程文档。
RED基线失败在没有技能的情况下运行压力测试记录 Agent 的错误行为和“合理化借口”。
GREEN最小实现编写针对性的 Skill 文档直接反驳那些借口确保 Agent 遵守规则。
REFACTOR封堵漏洞随着 Agent 找到新的绕过方式不断更新文档添加明确的反对意见。
2 核心工作流技能Superpowers 定义了从需求到交付的完整闭环Brainstorming任何创意工作前的必选项。
通过逐个提问、方案权衡生成设计文档。
Writing-plans将设计转化为
分钟粒度的可执行任务计划。
Executionsubagent-driven-development在当前会话中为每个任务分派子 Agent适合快速迭代。
executing-plans在并行会话中批量执行任务适合大规模实现。
Test-Driven-Development任何功能实现前先写失败测试。
Systematic-Debugging遇到 Bug 时强制执行“根因调查 - 模式分析 - 假设测试”流程严禁猜测性修复。
Verification-before-completion在声称“完成”前必须运行验证命令并检查输出。
3 强制触发原则Superpowers 的一条铁律如果认为有 1% 的可能性某个技能适用必须调用该技能。
这避免了 AI 的“合理化”倾向——即当任务看似简单时AI 往往会跳过必要的规范步骤如先写测试。
Planning with Files解决上下文遗忘的“外挂内存”Agent 在长任务中常面临Volatile Memory易失性记忆和Goal Drift目标漂移问题。
planning-with-filesSkill 引入了“三文件模式”将文件系统作为 Agent 的外部记忆。
1 三文件协议task_plan.md指挥塔作用定义目标、拆解阶段、追踪进度、记录状态。
机制Read-Before-Decide。
每一次关键行动前Agent 必须先读取此文件确认“我在哪、下一步干什么”对抗遗忘。
notes.md外部存储器作用存放调研材料、网页摘要、代码片段。
机制Store, Don’t Stuff。
将大量资料落盘只在 Context 中保留指针防止上下文填塞。
[deliverable].md最终交付物作用物理隔离“思考过程”与“最终结果”便于复用与交付。
2 核心机制这种模式本质上构建了一个File-Based State Machine基于文件的状态机。
通过不断更新task_plan.md中的状态如将[ ]改为[x]Agent 即使在上下文重置后也能从磁盘中恢复执行进度实现长程任务的可靠交付。
实战落地如何开发高质量 Skills
1 AI for AI开发 Skill 的最佳实践是默认让 AI 来写 Skill。
拉取官方 Skills 仓库作为参考。
清晰描述需求和基线失败场景。
让 Claude Opus/Sonnet 生成SKILL.md。
进行多模型测试Haiku/Sonnet/Opus。
2 工程原则依赖管理自包含在SKILL.md中声明依赖或在scripts/中提供setup.sh。
触发器前置在description中不仅写功能更要写明确的触发场景Trigger Phrases。
代码即工具不要在 Markdown 中写复杂的伪代码逻辑尽量下沉到 Python/Node.js 脚本中利用解释器的精确性。
格式规范遵循 YAML Frontmatter 规范路径统一使用正斜杠/拒绝 Windows 反斜杠。
六、
总结Agent Skills 标志着 AI 应用开发正在从“手工作坊”走向“工业化组装”。
Skills提供了标准化的能力封装与分发机制。
Superpowers引入了 TDD 和严格的流程规范保证了 Agent 的行为质量。
Planning with Files解决了长程任务的记忆与注意力管理问题。
MCP提供了强大的外部连接能力。
对于架构师和开发者而言未来的核心工作将不再是反复调试 Prompt而是设计合理的 Skill 边界构建企业专属的“能力货架”并灵活组合 Skills 与 MCP打造出既聪明又可靠的 AI Agent。
AI时代未来的就业机会在哪里答案就藏在大模型的浪潮里。
从ChatGPT、DeepSeek等日常工具到自然语言处理、计算机视觉、多模态等核心领域技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。
掌握大模型技能就是把握高薪未来。
那么普通人如何抓住大模型风口AI技术的普及对个人能力提出了新的要求在AI时代持续学习和适应新技术变得尤为重要。
无论是企业还是个人都需要不断更新知识体系提升与AI协作的能力以适应不断变化的工作环境。
因此这里给大家整理了一份《2026最新大模型全套学习资源》包括2026最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题、AI产品经理入门到精通等带你从零基础入门到精通快速掌握大模型技术由于篇幅有限有需要的小伙伴可以扫码获取
成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。
这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。
大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。
书籍含电子版PDF
大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。
大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。
大模型行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。
大模型面试题面试不仅是技术的较量更需要充分的准备。
在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。
为什么大家都在学AI大模型随着AI技术的发展企业对人才的需求从“单一技术”转向 “AI行业”双背景。
企业对人才的需求从“单一技术”转向 “AI行业”双背景。
金融AI、制造AI、医疗AI等跨界岗位薪资涨幅达30%-50%。
同时很多人面临优化裁员近期科技巨头英特尔裁员2万人传统岗位不断缩减因此转行AI势在必行这些资料有用吗这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。
本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。
大模型全套学习资料已整理打包有需要的小伙伴可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】