智能教育Agentic AI的伦理框架:提示工程架构师的设计原则与实践

核心内容摘要

写作小白救星!千笔·降AI率助手,领军级的降AI率网站
华南理工大学电信2023年数字信号处理期末高频考点解析与实战演练

【开源推荐】XYGo Admin:基于 Vue3 + GoFrame 的企业级后台管理系统(附源码)

“90%的Agent会被大模型吃掉。

”7月15日金沙江创投主管合伙人朱啸虎一如既往地语出惊人这次炮轰的是近一年AI圈最炙手可热的Agent。

在“Agent之年”进程过半的时候最近传来的似乎却多是悲观的判断和信息。

就在上周Manus总部迁移至新加坡、国内裁员80人以及放弃国内版本上线的一系列动态也让大众开始讨论起Manus到底怎么了背后有身为美元基金的BenchMark领投、底层模型包含Gemini、Claude等一系列海外模型加之曾陷入缺算力资源的传闻Manus的出走已经印证为形势所迫的转移和调整而非经营失败导致的撤退。

但围绕以Manus为首的通用Agent它们头顶的乌云尚未散去一边是Manus、Genspark们收入变现的下滑另一边是用户活跃度的下跌。

这种局面揭示了当下通用Agent赛道的核心问题在技术热潮和资本狂欢过后产品尚未找到能让广大C端用户持续“忠诚”并为之付费的杀手级应用场景只能被偶尔拿来做个半成品PPT、找几份报告。

通用Agent市场正在被模型能力的溢出蚕食也被垂类Agent抢走份额。

转战海外Manus们怎么了通用Agent陷入了一个尴尬的境地。

在几个月的时间里通用Agent诞生时的惊艳不复存在放在企业里它无法和垂类Agent的精准比肩拿到个人手上它又没有找到更戳中用户需求的场景。

模型能力的提升先对Agent们“砍了一刀”。

随着大模型能力的飞速发展模型本身正在变得越来越“Agent化”随着模型性能的溢出用户可以直接调用模型来完成任务。

以目前进展更快的AI代码为例Anthropic的Claude、谷歌的Gemini系列模型模型本身的编码能力就在随着更新提升其自研的编码工具如Claude Code不仅能给实现自主编程优化种种产品体验之外它的Max会员模式还支持用户随意调用自家模型即使是每百万输出tokens收费75美元的Opus 4单月200美元同样支持不限量使用。

对比Manus最贵的Pro会员每月199美元的付费模式价格虽然接近但Manus的最高档会员依旧是以积分制消费Pro会员单月能获得每日赠送的积分单月19900积分限时19900积分靠任务消耗积分制来服务。

按照单个任务100积分估算一天使用次数也就在10次左右。

制约Manus的成本问题转嫁到用户身上就是不可消除的高订阅价。

当模型本身就能提供接近Agent的体验时用户会自然倾向于直接使用更便宜、更便捷的模型API或对话界面而非额外付费使用一个功能重叠的通用Agent产品。

这导致一部分市场份额被能力日益强大的基础模型直接“吃掉”。

面向用户来说对比垂类Agent通用Agent在企业端的应用效果不佳从效率/成果衡量都无法达到“数字员工”的高度。

朱啸虎说“90%的Agent市场会被吃掉”但他所在的金沙江创投也参与了AI Agent项目融资只是相比于通用Agent他更看好能真正跑出效率和实际落地的产品。

金沙江投资的Head AI原Aha Lab就是一家靠AI Agent做自动化营销的公司现在升级为AI营销产品。

用创始人的话来说只需告诉 Head 你的预算和网站它就能自动搞定达人营销、联盟营销和 Cold Email——一个人解决一个市场部。

对于企业用户而言准确度和成本是核心诉求。

但通用Agent目前还无法与针对特定场景优化的垂类Agent相提并论。

如果把一样的任务交给通用Agent和企业内部的垂类Agent去做前者只能靠搜索引擎结合需求给出结果而后者则会连接到企业内部搭建好的知识库根据内部信息贴合需求输出相当于后者身上“绑”了个更充足的资料库结果不言而喻。

企业在引入新技术时对成本和风险的控制要求极高。

通用Agent通常基于庞大而复杂的“黑盒”模型其决策过程不透明且输出结果存在一定的随机性即“幻觉”问题。

对准确度要求更高的企业显然无法接受通用Agent不稳定的输出质量。

一位Agent开发者告诉光锥智能企业通常需要将Agent与内部知识库、业务流程系统深度集成部分简单的工作则会通过工作流来确保任务准确执行。

夹在大模型和垂类Agent之间通用Agent被两者各自瓜分走了一大块蛋糕。

没场景、待进化Agent才走了个开头在“用不起来”的情况下用户对通用Agent热情也不复当初。

这也导致以Manus们为代表的C端通用Agent正在面临增长放缓、甚至倒退的困境。

虽然从商业化上来说通用Agent确实展现了足够吸金的一面。

以Manus、Genspark等通用Agent为代表近几个月的变现成绩证明了这个赛道的潜力非凡产研数据显示今年5月Manus已经达到936万美元ARR年化收入Genspark更是在发布45天的情况下达到3600万美元ARR。

但在短期的流量上涨过后通用Agent产品们或多或少地出现了访问量和收入下降的情况。

6月Manus访问量为1781万和3月发布即登顶的访问量2376万相比已经下跌25%Genspark的访问量也处在来回浮动的状态6月访问量为842万次下降8%昆仑万维天工超级智能体下降

7%。

同样是在6月两个商业化表现突出的产品Manus和Genspark出现不同程度的收入下跌。

据非凡产研数据Manus当月MRR月度收入为254万美金环比下跌超过50%Genspark当月MRR为295万美金环比下跌

1

58%。

上述数据说明在一时的热度过后 通用Agent类产品的使用体验并没有能让用户持续付费的吸引力。

同时用户体验的频次也在减弱。

究其原因还是因为Manus们没有找到足够让用户为之持续付费的Killer杀手级场景。

目前市场上多数通用Agent都在卷几个固定的方向做PPT、多模态能力、写报告Deep Research多聚焦于和办公强相关的场景。

但对于用户来说这些定位还难以让用户持续付费。

在没有找到确切的应用方向前通用Agent赛道已经有一批公司先靠产品下水测试意图先抢占市场。

变现和流量不稳定的情况下大厂对自研Agent的精力投入有限一般还是采取“两手抓”的模式在开发自家Agent产品之外目前更多地在推广自家Agent开发平台。

比如阿里、字节和百度推广平台的同时发福利、组织Agent开发比赛聚焦开发者生态搭建。

市场似乎已经默认通用Agent是小厂玩不起的生意。

可以看到在国内市场除去Manus和GensPark零星几家创业公司多数通用Agent的开发公司都是手握自研大模型的公司其中大厂不仅有模型背后还有自家云做支援。

通用Agent既是产品也是他们作为B端平台通过C端产品展示能力的一面镜子以此招徕更多开发者。

大模型创业公司则本着“模型即Agent”的思路更多在模型层就针对Agent对RL强化学习、长文本等需求钻研模型才有了通用Agent产品。

国内通用Agent玩家的收费模式也比出海的方式更卷。

以百度、字节为代表的大厂有能力公开测试免费提供服务。

如MiniMax、天工智能体等则以限量使用或是购买积分使用的方式开放。

和大厂免费不限量的手段相比国内通用Agent赛道注定会越来越卷商业化变现是一条看不到收益的路。

从场景来看DeepResearch式的深度研究功能是更多产品选择主攻的方向对于文档类Agent来说调用工具的复杂程度相对较低且文本生成的成本更低算是一个更有性价比的方向。

在开发深度研究功能的基础上各家Agent开始在多模态能力和应用场景上发力。

一方面在生成的文档中插入图片、视频等多模态能力另一方面把目前和Agent契合的场景植入到通用Agent中比如做PPT几乎成了办公Agent的标配。

但无论是拿来做报告再用图文锦上添花还是用Agent做PPT背后都无法解决Agent输出效果一般的问题。

比如一份深度研究报告Agent最容易出现的是对事实信息检索的错漏比如无法厘清Agent概念从而推荐大模型产品。

进一步的问题是输出的信息价值不高。

一份报告零星只有

个信源更多内容从网络筛选得来往往只能得到模棱两可的“废话”。

比如要它介绍大模型公司的生存挑战它把开公司可能存在的问题都列个遍既没有针对性也不具备有价值的增量信息。

于是企业开始探索更多Agent能匹配的场景试图吸引更多用户参与。

Agent也难免后续变成自家公司产品的“集合入口”被公司用各种方式把自家产品能力整合进去比如MiniMax融入了海螺生视频的能力百度心响在场景中接入了原有的智能体对话等。

除了找不到贴合场景当前Agent能力有限效果不一也难以让用户为之买单。

通用Agent执行任务一般是拆解任务再按照步骤执行。

越复杂的任务就意味着Agent执行的过程更多其中只要有任何一个步骤跑出的结果有问题就会导致整体输出结果质量不佳。

所以对于复杂任务来说当前Agent执行的稳定性不足。

比如输出对一家公司的分析就要从财报信息抓取、公司网页介绍到各大信源的分析点评其中有任何一个环节结果出错整体报告的分析质量就会大打折扣。

当下一些Agent开发者正试图通过技术创新来突破这些瓶颈。

比如MiniMax把年初发布的新的线性注意力机制用到了新模型M1中其智能体产品以M1模型为基座模型。

这样的好处是大幅扩展了智能体能够承载的文本量支持100万的上下文输入针对法律文书这类需要大量文本分析的场景效果更好。

月之暗面则强调“模型即Agent”其基座模型是月之暗面基于端到端自主强化学习技术训练的新一代 Agent 模型。

其中RL强化学习成为这个深度研究Agent的亮点。

多数业内人曾在和光锥智能交流中肯定RL之于Agent的重要性。

相比传统的监督学习或预训练模型在特定任务上表现出色但其泛化能力往往受限于训练数据的分布。

当Agent需要处理的任务场景多样化、环境动态变化时预设规则或仅依赖一次性推理的Agent难以适应。

比如在处理一些需要多个流程完成的任务中传统模式可能在任一个环节中出现推测问题进而影响到最终结果但RL则是靠大量试错和奖励机制来提升泛化能力对于需要多个步骤处理的复杂任务表现效果更好。

Kimi-Researcher主动针对矛盾信息的处理可以说RL能够大幅提升Agent的能力上限。

Kimi-Researcher研究员冯一尘分享在Humanitys Last ExamHLE人类的最后一场考试衡量AI在各学科难题上的测试榜单上gent模型得分从最初的

6%跃升至

2

9%相比OpenAI Deep Research团队在相关工作上从20分左右o3提升到

2

6分的成果进一步证明了强化学习在Agent训练上的巨大价值。

在技术的天花板还够高的情况下后来者正在拔高Agent的能力标准。

今日7月18日OpenAI发布的通用Agent产品ChatGPT Agent跑出了一个漂亮的效果在HLE 测试表现上取得了

4

6%的新SOTA 成绩。

通过强化学习Agent有望从简单的“工具调用器”进化为真正具备“自主学习”和“环境适应”能力的智能体。

届时通用Agent或许才能真正找到杀手级场景并让用户心甘情愿地为其买单。

Agent的路还很长只有靠技术突破和场景深耕才能成为真正帮得上忙的AI助手。

如何学习AGI大模型作为一名热心肠的互联网老兵我决定把宝贵的AI知识分享给大家。

至于能学习到多少就看你的学习毅力和能力了 。

我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

因篇幅有限仅展示部分资料需要点击下方链接即可前往获取**

2025最新大模型学习路线一个明确的学习路线可以帮助新人了解从哪里开始按照什么顺序学习以及需要掌握哪些知识点。

大模型领域涉及的知识点非常广泛没有明确的学习路线可能会导致新人感到迷茫不知道应该专注于哪些内容。

我们把学习路线分成L1到L4四个阶段一步步带你从入门到进阶从理论到实战。

L1级别:AI大模型时代的华丽登场L1阶段我们会去了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理

关键技术以及大模型应用场景通过理论原理结合多个项目实战从提示工程基础到提示工程进阶掌握Prompt提示工程。

L2级别AI大模型RAG应用开发工程L2阶段是我们的AI大模型RAG应用开发工程我们会去学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。

L3级别大模型Agent应用架构进阶实践L3阶段大模型Agent应用架构进阶实现我们会去学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造我们自己的Agent智能体同时还可以学习到包括Coze、Dify在内的可视化工具的使用。

L4级别大模型微调与私有化部署L4阶段大模型的微调和私有化部署我们会更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。

整个大模型学习路线L1主要是对大模型的理论基础、生态以及提示词他的一个学习掌握而L3 L4更多的是通过项目实战来掌握大模型的应用开发针对以上大模型的学习路线我们也整理了对应的学习视频教程和配套的学习资料。

大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。

书籍含电子版PDF

大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。

大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。

大模型面试题面试不仅是技术的较量更需要充分的准备。

在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。

因篇幅有限仅展示部分资料需要点击下方链接即可前往获取

榴莲视频IOS下载-榴莲视频IOS下载应用

百度百家号客服电话人工服务

123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123