核心内容摘要
魂穿斗罗:唐三阿银的“不亦乐乎”人生,藏着MBA的商业智慧?
大语言模型综合排行榜
原创 网球玩的人 老网的博客2026年2月1日 16:25加拿大本周排名前10的模型为Gemini 3 ProGPT-
2Gemini 3 FlashClaude Opus
5GPT-
1Kimi-K
5GPT-5DeepSeek v
2GLM-
7GPT-
1 Mini简介本表格汇总了常用大语言模型在主流评测排行榜上的表现。
评测范围涵盖人类偏好文字和视觉知识与推理数学能力代码能力长文本推理和指令遵循能力。
在整合各项评测结果的基础上计算出综合排名。
更新本次排名Kimi-K
5模型首次加入榜单。
它没有特别出彩的表现但综合实力均衡且比Kimi-K2有明显提升跻身第六。
artifical analysis边的数据更新了Qwen 3 max的推理模型的结果。
比起非推理模型整体能力大幅提升。
除了gpt-
5本榜单所有模型皆为推理模型。
推理能力基本上是顶尖模型的标配了。