当前位置：首页 > 元宇宙 > AI

DeepSeek 丢了开源第一王座，但继任者“Kimi K2”依然来自中国

来源：责编：时间：2025-07-20 18:16:30 197观看

导读几千人盲投，Kimi K2 超越 DeepSeek 拿下全球开源第一！歪果网友们直接炸了，评论区秒变夸夸打卡现场：今天，竞技场终于更新了 Kimi K2 的排名情况 ——开源第一，总榜第五，而且紧追马斯克 Grok 4 这样的顶尖闭源模型。并

几千人盲投，Kimi K2 超越 DeepSeek 拿下全球开源第一！

歪果网友们直接炸了，评论区秒变夸夸打卡现场：

今天，竞技场终于更新了 Kimi K2 的排名情况 ——

开源第一，总榜第五，而且紧追马斯克 Grok 4 这样的顶尖闭源模型。

并且各类单项能力也不差，能和一水儿闭源模型打得有来有回：

连续多轮对话并列第一，o3 和 Grok 4 均为第四；

编程能力第二，和 GPT 4.5、Grok 4 持平；

应对复杂提示词能力第二，和 o3、4o 位于同一梯队；

……

甚至眼尖的朋友也发现了，唯二闯入总榜 TOP 10 的开源模型都来自中国。（DeepSeek R1 总榜第 8）

当然了，即使抛开榜单不谈，Kimi 这款新模型过去一周也确实火热 ——

K2 过去一周真热啊

公开可查战绩包括但不限于下面这些：

从实打实的数据来看，发布这一周里，Kimi K2 在开源社区就获得了相当关注度和下载量。

GitHub 标星 5.6K，Hugging Face 下载量近 10 万，这还不算它在中国社区的应用。

连 AI 搜索引擎明星创企 Perplexity CEO 也亲自为它站台，并透露：

Kimi K2 在内部评估中表现出色，Perplexity 计划接下来基于 K2 模型进行后训练。

甚至由于访问的用户太多了，逼得 Kimi 官方也出来发公告：

访问量大 + 模型体积大，导致 API 过慢。

……

不过就在一片向好之时，人们关于“Kimi K2 采用了 DeepSeek V3 架构”的质疑声再度升温。

对此，我们也找到了 Kimi 团队成员关于 K2 架构的相关回应。

总结下来就是，确实继承了 DeepSeek V3 的架构，不过后续还有一系列参数调整。

p.s. 以下分享均来自知乎 @刘少伟，内容经概括总结如下~

一开始，他们尝试了各种架构方案，结果发现 V3 架构是最能打的（其他顶多旗鼓相当）。

所以问题就变成了，要不要为了不同而不同？

经过深思熟虑，团队给出了否定答案。理由有两点：

一是 V3 架构珠玉在前且已经经过大规模验证，没必要强行“标新立异”；二是自己和 DeepSeek 一样，训练和推理资源非常有限，而经过评估 V3 架构符合相关成本预算。

所以他们选择了完全继承 V3 架构，并引入适合自己的模型结构参数。

具体而言，K2 的结构参数改动有四点：

增加专家数量：团队验证了在激活参数量不变的情况下，MoE 总参数增加仍有益于 loss 下降。

注意力头 head 数减半：减少 head 数节省的成本，刚好抵消 MoE 参数变大带来的开销，且效果影响很小。

只保留第一层 Dense：只保留第一层为 dense，其余都用 MoE，结果对推理几乎无影响。

专家无分组：通过自由路由 + 动态重排（EPLB）可以应对负载不均衡，同时让专家组合更灵活，模型能力更强。

最终得到的推理方案就是，在相同专家数量下：

虽然总参数增大到 1.5 倍，但除去通信部分，理论的 prefill 和 decode 耗时都更小。即使考虑与通信 overlap 等复杂因素，这个方案也不会比 V3 有显著的成本增加。

就是说，这是一种更“精打细算”的结构调优。

而且这种放弃自己的模型架构路线，彻底走 DeepSeek 路线的做法，也被国内网友评价为“相当大胆”。

△ 来源：知乎网友 @蛙哥

OK，以上关于 Kimi 和 DeepSeek 架构之争的问题落定后，我们再把目光拉回到这次最新排名。

开源追平 or 超越闭源 ing

一个很明显的趋势是：「开源 = 性能弱」的刻板印象正在被打破，开源模型已经越来越厉害了。

不仅榜单上的整体排名在上升，而且分数差距也越来越小。

仔细看，模型 TOP 10 总分均为 1400+，开源和闭源几乎可以看成位于同一起跑线。

而且这次拿下开源第一的 Kimi K2，总分已经非常接近 Grok 4、GPT 4.5 等顶尖闭源模型了。

换句话说，以前我们可能还要在模型能力和成本之间作取舍，但随着开源力量的崛起，多思考一秒钟都是对开源的不尊重（doge）。

与此同时，越来越多的行业人士也表达了对开源崛起的判断。

艾伦人工智能研究所研究科学家 Tim Dettmers 表示：

开源击败闭源将变得越来越普遍。

Perplexity CEO 也多次在公开场合表示：

开源模型将在塑造 AI 能力的全球扩散路径中扮演重要角色。它们对于因地制宜地定制和本地化 AI 体验至关重要。

而在已经逐渐崛起的开源模型领域，TOP 10 中唯二开源、且都是国产模型的含金量还在上升。

参考链接：

[1]https://x.com/lmarena_ai/status/1945866381880373490

[2]https://www.zhihu.com/question/1927140506573435010/answer/1927892108636849910

[3]https://zhuanlan.zhihu.com/p/1928863438324623337

本文来自微信公众号：量子位（ID：QbitAI），作者：一水

本文链接：http://www.28at.com/showinfo-45-14683-0.htmlDeepSeek 丢了开源第一王座，但继任者“Kimi K2”依然来自中国

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：欧盟为具有系统性风险的 AI 模型定规矩：若发生严重事故必须上报，网安工作要到位

下一篇： Meta 全新 AI 组织架构曝光，这范儿有点字节

标签：

热门焦点

AI网红能年赚百万，普通人的新机会来了？

来源｜运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁2023 年，数字人成为了当红的“流量话题”和“商业机会"。不管是 AI 孙燕姿走红网络，还是 AI 数字
数字人的新革命，BAT的“冲高”战场

来源：刘旷ChatGPT横空出世，让人们看到了数字人的另一种可能，将ChatGPT与虚拟数字人融合，研发出更加智能化、拟人化的虚拟数字人成为数字人厂商的新命题、新方向。2月份，岭南股份
超跑与NFT的首次结合，兰博基尼能否破局？

兰博基尼公司近日称即将推出它的首款NFT，并且将加速进军区块链领域。这家闻名遐迩的意大利汽车厂商野心勃勃地将目光投向混合动力和电动跑车，并宣布将拍卖与瑞士
“元宇宙第一股”Roblox缘何被资本市场看“低”？

近期，冬奥会的召开受到广泛关注，而吉祥物冰墩墩也成为新晋“顶流”，“一墩难求”成为普遍心声，为了满足大众需求，nWayPlay平台曾在2月12日发售了一款由国际奥委会官
Meta、谷歌、微软竞相涌入元宇宙，小型企业该如何伺机而动？

目前来看元宇宙不会影响到小型企业的发展，但在接下来的十年内可能会发生很多变化。很多有商业头脑的企业家都在密切关注着元宇宙的发展。元宇宙这个词，你一定或
国内涌现70余家数字藏品平台：合规、流量与利润在博弈

作者：杨郑君2月16日，迅雷链企业数字藏品服务平台正式上线，继阿里、腾讯、京东、百度、网易等之后，又一家互联网企业正式加入到火热的数字藏品平台的竞争中。除互联
以太坊伦敦升级后，随之生效的以太坊EIP-1559是什么？

作者：三黎过去的一年里，除了 BTC 一如既往稳坐王位，DEFI 则是贯穿一整年的狂欢热点。 DeFi 在让 ETH 实现价值增长的同时，也使得其网络日渐拥堵、交易费用增高，成为
NFTs正迎来数十亿美元的繁荣--NFT零工经济从业者开始暴赚

当Stefan Prodanovic在13岁时开始尝试平面设计，与一位从事编程工作的学校朋友共同创作数字游戏时，他从未料到这个爱好会在他成年后变成一个相当有利可图的生意。
又一家数字营销公司入局元宇宙，国内首个艺术元宇宙社区“Meta彼岸”上线

作者：董宇佳2月28日，智度股份在北京举办产品发布会，宣布其与国光电器联手打造的国内首个艺术元宇宙社区——“Meta彼岸”在VR端和移动端正式公测。从科技巨头布局

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

DeepSeek 丢了开源第一王座，但继任者“Kimi K2”依然来自中国

AI网红能年赚百万，普通人的新机会来了？

数字人的新革命，BAT的“冲高”战场

超跑与NFT的首次结合，兰博基尼能否破局？

“元宇宙第一股”Roblox缘何被资本市场看“低”？

Meta、谷歌、微软竞相涌入元宇宙，小型企业该如何伺机而动？

国内涌现70余家数字藏品平台：合规、流量与利润在博弈

以太坊伦敦升级后，随之生效的以太坊EIP-1559是什么？

NFTs正迎来数十亿美元的繁荣--NFT零工经济从业者开始暴赚

又一家数字营销公司入局元宇宙，国内首个艺术元宇宙社区“Meta彼岸”上线

最新推荐

刷完一场元宇宙世界杯音乐盛典，我爽了

“任何国产元宇宙都是假元宇宙”

“啫喱”超越微信登顶：首款“元宇宙社交App”会昙花一现吗？

2021年中国元宇宙行业用户行为分析热点报告

元宇宙需要的5个重要安全功能

Steam 禁止NFT和加密货币原因曝光

猜你喜欢

热门推荐

相关资讯