白桃微醺,心糖初绽:寻觅那抹藏于Logo的白桃少女

核心内容摘要

探寻视界新维度:“yellow视频在线免费观看”的无限可能
78号男生与女神的网页情缘:当代码遇见心动

探寻“秘”之魅:一场穿越时空的奥秘之旅

大语言模型综合排行榜

原创 网球玩的人 老网的博客2026年2月1日 16:25加拿大本周排名前10的模型为Gemini 3 ProGPT-

2Gemini 3 FlashClaude Opus

5GPT-

1Kimi-K

5GPT-5DeepSeek v

2GLM-

7GPT-

1 Mini简介本表格汇总了常用大语言模型在主流评测排行榜上的表现。

评测范围涵盖人类偏好文字和视觉知识与推理数学能力代码能力长文本推理和指令遵循能力。

在整合各项评测结果的基础上计算出综合排名。

更新本次排名Kimi-K

5模型首次加入榜单。

它没有特别出彩的表现但综合实力均衡且比Kimi-K2有明显提升跻身第六。

artifical analysis边的数据更新了Qwen 3 max的推理模型的结果。

比起非推理模型整体能力大幅提升。

除了gpt-

5本榜单所有模型皆为推理模型。

推理能力基本上是顶尖模型的标配了。

总结综合实力最强Gemini 3 Pro国内最强模型Kimi-K

5/DeepSeek v

2/GLM-

7最强开源模型Kimi-K

5/DeepSeek v

2/GLM-

7最强代码模型Gemini 3 Pro/GPT-

2/Claude Opus

5本项目仓库https://github.com/Tennisatw/LLM-Leaderboard

江教授的日常生活7肉馅水饺-江教授的日常生活7肉馅水饺应用

百度百家号客服电话人工服务

123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123