核心内容摘要
【2025最新】基于SpringBoot+Vue的.社区疫情管理系统管理系统源码+MyBatis+MySQL
去年 8 月底 Agentic 编程平台 Qoder 面向全球开发者发布并提出了面向真实软件开发的智能体编程平台的定位。
短短5个月后的今天上线了首个定制模型 Qwen-Coder-Qoder补齐了专属模型最后一块拼图。
这款模型基于 Qwen-Coder 基座并紧贴 Qoder 的 Agent 框架、工具与场景进行了大规模强化学习训练。
在面向真实软件工程任务的评测集 Qoder Bench 上Qwen-Coder-Qoder 的任务解决率超过了 Cursor Composer-1尤其在 Windows 系统下的终端命令准确率方面领先幅度达到 50%。
升级后的Qoder平台已在线上真实用户环境中取得了显著成效。
数据显示得益于模型的快速迭代。
Qoder生成代码的线上留存率提升了
85%工具异常率下降
6
5%Token消耗降低了
1
5%数据整体已接近世界顶级模型水平。
除了数据上的提升定制模型还赋予了Qoder更接近资深开发者的开发者思维它不仅能严格遵循项目独有的软件工程规范还能基于代码图谱、项目记忆等上下文信息从全局视角理解代码仓库甚至在面对棘手问题时能像人类开发者一样持续尝试直至问题解决。
智能进化体系Qwen-Coder-Qoder诞生的必然当前 AI Coding 领域正在快速发展Qoder团队构建了一套模型即AgentAgent即产品产品增强模型的智能进化体系模型即 Agent将Qoder Agent所需的各种能力如遵循工程规范、高效规划任务、理解代码图谱等直接训练到Qwen-Coder-Qoder中让模型直接驱动Agent执行任务。
Agent 即产品在Qoder中Agent是产品的核心一切功能都围绕Qoder Agent展开。
产品增强模型产品触达万千用户能够感知用户的真实行为和偏好。
Qoder从中发掘出软件工程的最佳开发实践并将其转化为奖励信号用于增强模型的训练。
这形成了一个大模型软件工程智能的进化体系。
Qwen-Coder-Qoder正是基于真实产品环境、真实软件开发任务、真实软件开发奖励而训练的大规模强化学习模型。
扎实的技术方案如何炼成一个懂软件工程的模型为了实现上述理念Qoder 团队构建了一套扎实且先进的训练方案。
真实的产品环境作为沙盒环境Qoder让模型在真实的Qoder Agent环境中进行强化学习其中集成了Qoder的Knowledge、Memory、Tools/MCP等所有组件确保训练与推理的一致性。
同时Qoder构建了完整的自动化项目可执行环境构建链路依靠强大的虚拟化容器技术可快速拉起和销毁数万级别的容器为模型提供真实且丰富的探索环境。
真实的软件工程实践作为奖励信号Reward奖励在智能体训练中至关重要。
Qoder团队不仅通过单测、命令行验证等方式确保任务的正确性更为了应对Reward Hacking模型为骗取奖励而做出有害行为这一挑战专门构建了一套Rewarder - Attacker对抗式审查机制有效提升了Reward系统的速度和健壮性。
大规模高效的强化学习训练框架Qwen-Coder-Qoder使用ROLLReinforcement Learning on Large-scale Language models训练框架。
Qoder团队通过一系列系统级优化让千卡规模集群能够高效完成千亿参数MoE LLM的RL后训练获得了超过10倍的端到端吞吐提升将模型训练周期缩短至周级别为Qoder的快速迭代提供了坚实基础。
未来展望持续进化的开发者体验从发布到推出定制模型Qoder团队仅用了5个月。
这只是一个开始。
Qoder负责人丁宇表示“Qwen-Coder-Qoder是我们智能进化体系的初版成果在过去几个月的迭代中我们已经看到了它对整体开发体验提升的巨大潜力。
未来我们将继续坚定地沿着这条路走下去通过周级别的快速迭代不断提升模型效果与用户体验。
”Qoder将持续投入模型与产品的深度融合朝着面向真实软件的智能体编程平台的愿景不断迈进。
为回馈全球开发者开启了新模型2周限免体验活动欢迎使用https://qoder.com/blog/qwen-coder-qoder?sessionid