当前位置:首页 > 元宇宙 > AI

DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国

来源: 责编: 时间:2025-07-20 18:16:30 116观看
导读 几千人盲投,Kimi K2 超越 DeepSeek 拿下全球开源第一!歪果网友们直接炸了,评论区秒变夸夸打卡现场:今天,竞技场终于更新了 Kimi K2 的排名情况 ——开源第一,总榜第五,而且紧追马斯克 Grok 4 这样的顶尖闭源模型。并

几千人盲投,Kimi K2 超越 DeepSeek 拿下全球开源第一!q7p28资讯网——每日最新资讯28at.com

歪果网友们直接炸了,评论区秒变夸夸打卡现场:q7p28资讯网——每日最新资讯28at.com

q7p28资讯网——每日最新资讯28at.com

今天,竞技场终于更新了 Kimi K2 的排名情况 ——q7p28资讯网——每日最新资讯28at.com

开源第一,总榜第五,而且紧追马斯克 Grok 4 这样的顶尖闭源模型。q7p28资讯网——每日最新资讯28at.com

q7p28资讯网——每日最新资讯28at.com

并且各类单项能力也不差,能和一水儿闭源模型打得有来有回:q7p28资讯网——每日最新资讯28at.com

连续多轮对话并列第一,o3 和 Grok 4 均为第四;q7p28资讯网——每日最新资讯28at.com

编程能力第二,和 GPT 4.5、Grok 4 持平;q7p28资讯网——每日最新资讯28at.com

应对复杂提示词能力第二,和 o3、4o 位于同一梯队;q7p28资讯网——每日最新资讯28at.com

……q7p28资讯网——每日最新资讯28at.com

甚至眼尖的朋友也发现了,唯二闯入总榜 TOP 10 的开源模型都来自中国。(DeepSeek R1 总榜第 8)q7p28资讯网——每日最新资讯28at.com

当然了,即使抛开榜单不谈,Kimi 这款新模型过去一周也确实火热 ——q7p28资讯网——每日最新资讯28at.com

K2 过去一周真热啊

公开可查战绩包括但不限于下面这些:q7p28资讯网——每日最新资讯28at.com

从实打实的数据来看,发布这一周里,Kimi K2 在开源社区就获得了相当关注度和下载量。q7p28资讯网——每日最新资讯28at.com

GitHub 标星 5.6K,Hugging Face 下载量近 10 万,这还不算它在中国社区的应用。q7p28资讯网——每日最新资讯28at.com

q7p28资讯网——每日最新资讯28at.com

q7p28资讯网——每日最新资讯28at.com

连 AI 搜索引擎明星创企 Perplexity CEO 也亲自为它站台,并透露:q7p28资讯网——每日最新资讯28at.com

Kimi K2 在内部评估中表现出色,Perplexity 计划接下来基于 K2 模型进行后训练。q7p28资讯网——每日最新资讯28at.com

q7p28资讯网——每日最新资讯28at.com

甚至由于访问的用户太多了,逼得 Kimi 官方也出来发公告:q7p28资讯网——每日最新资讯28at.com

访问量大 + 模型体积大,导致 API 过慢。q7p28资讯网——每日最新资讯28at.com

q7p28资讯网——每日最新资讯28at.com

……q7p28资讯网——每日最新资讯28at.com

不过就在一片向好之时,人们关于“Kimi K2 采用了 DeepSeek V3 架构”的质疑声再度升温。q7p28资讯网——每日最新资讯28at.com

q7p28资讯网——每日最新资讯28at.com

对此,我们也找到了 Kimi 团队成员关于 K2 架构的相关回应。q7p28资讯网——每日最新资讯28at.com

总结下来就是,确实继承了 DeepSeek V3 的架构,不过后续还有一系列参数调整。q7p28资讯网——每日最新资讯28at.com

p.s. 以下分享均来自知乎 @刘少伟,内容经概括总结如下~q7p28资讯网——每日最新资讯28at.com

一开始,他们尝试了各种架构方案,结果发现 V3 架构是最能打的(其他顶多旗鼓相当)。q7p28资讯网——每日最新资讯28at.com

所以问题就变成了,要不要为了不同而不同?q7p28资讯网——每日最新资讯28at.com

经过深思熟虑,团队给出了否定答案。理由有两点:q7p28资讯网——每日最新资讯28at.com

一是 V3 架构珠玉在前且已经经过大规模验证,没必要强行“标新立异”;二是自己和 DeepSeek 一样,训练和推理资源非常有限,而经过评估 V3 架构符合相关成本预算。q7p28资讯网——每日最新资讯28at.com

所以他们选择了完全继承 V3 架构,并引入适合自己的模型结构参数。q7p28资讯网——每日最新资讯28at.com

具体而言,K2 的结构参数改动有四点:q7p28资讯网——每日最新资讯28at.com

增加专家数量:团队验证了在激活参数量不变的情况下,MoE 总参数增加仍有益于 loss 下降。q7p28资讯网——每日最新资讯28at.com

注意力头 head 数减半:减少 head 数节省的成本,刚好抵消 MoE 参数变大带来的开销,且效果影响很小。q7p28资讯网——每日最新资讯28at.com

只保留第一层 Dense:只保留第一层为 dense,其余都用 MoE,结果对推理几乎无影响。q7p28资讯网——每日最新资讯28at.com

专家无分组:通过自由路由 + 动态重排(EPLB)可以应对负载不均衡,同时让专家组合更灵活,模型能力更强。q7p28资讯网——每日最新资讯28at.com

q7p28资讯网——每日最新资讯28at.com

最终得到的推理方案就是,在相同专家数量下:q7p28资讯网——每日最新资讯28at.com

虽然总参数增大到 1.5 倍,但除去通信部分,理论的 prefill 和 decode 耗时都更小。即使考虑与通信 overlap 等复杂因素,这个方案也不会比 V3 有显著的成本增加。q7p28资讯网——每日最新资讯28at.com

就是说,这是一种更“精打细算”的结构调优。q7p28资讯网——每日最新资讯28at.com

而且这种放弃自己的模型架构路线,彻底走 DeepSeek 路线的做法,也被国内网友评价为“相当大胆”。q7p28资讯网——每日最新资讯28at.com

q7p28资讯网——每日最新资讯28at.com

△ 来源:知乎网友 @蛙哥q7p28资讯网——每日最新资讯28at.com

OK,以上关于 Kimi 和 DeepSeek 架构之争的问题落定后,我们再把目光拉回到这次最新排名。q7p28资讯网——每日最新资讯28at.com

开源追平 or 超越闭源 ing

一个很明显的趋势是:「开源 = 性能弱」的刻板印象正在被打破,开源模型已经越来越厉害了。q7p28资讯网——每日最新资讯28at.com

不仅榜单上的整体排名在上升,而且分数差距也越来越小。q7p28资讯网——每日最新资讯28at.com

仔细看,模型 TOP 10 总分均为 1400+,开源和闭源几乎可以看成位于同一起跑线。q7p28资讯网——每日最新资讯28at.com

而且这次拿下开源第一的 Kimi K2,总分已经非常接近 Grok 4、GPT 4.5 等顶尖闭源模型了。q7p28资讯网——每日最新资讯28at.com

q7p28资讯网——每日最新资讯28at.com

换句话说,以前我们可能还要在模型能力和成本之间作取舍,但随着开源力量的崛起,多思考一秒钟都是对开源的不尊重(doge)。q7p28资讯网——每日最新资讯28at.com

与此同时,越来越多的行业人士也表达了对开源崛起的判断。q7p28资讯网——每日最新资讯28at.com

艾伦人工智能研究所研究科学家 Tim Dettmers 表示:q7p28资讯网——每日最新资讯28at.com

开源击败闭源将变得越来越普遍。q7p28资讯网——每日最新资讯28at.com

q7p28资讯网——每日最新资讯28at.com

Perplexity CEO 也多次在公开场合表示:q7p28资讯网——每日最新资讯28at.com

开源模型将在塑造 AI 能力的全球扩散路径中扮演重要角色。它们对于因地制宜地定制和本地化 AI 体验至关重要。q7p28资讯网——每日最新资讯28at.com

而在已经逐渐崛起的开源模型领域,TOP 10 中唯二开源、且都是国产模型的含金量还在上升。q7p28资讯网——每日最新资讯28at.com

参考链接:q7p28资讯网——每日最新资讯28at.com

[1]https://x.com/lmarena_ai/status/1945866381880373490q7p28资讯网——每日最新资讯28at.com

[2]https://www.zhihu.com/question/1927140506573435010/answer/1927892108636849910q7p28资讯网——每日最新资讯28at.com

[3]https://zhuanlan.zhihu.com/p/1928863438324623337q7p28资讯网——每日最新资讯28at.com

本文来自微信公众号:量子位(ID:QbitAI),作者:一水q7p28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-14683-0.htmlDeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 欧盟为具有系统性风险的 AI 模型定规矩:若发生严重事故必须上报,网安工作要到位

下一篇: Meta 全新 AI 组织架构曝光,这范儿有点字节

标签:
  • 热门焦点
  • 蓝标亏钱、Meta裁员:天下秀还值得砸钱元宇宙吗?

    日前,天下秀数字科技集团正式公布了2022年报及2023年一季报。报告显示,2022年天下秀实现营收41.29亿元,同比下滑8.48%;归母净利润1.8亿元,同比下滑49.2%,几乎出现了盈利腰斩的态势
  • 避坑指南:远离具有这些特性的NFT

    关于NFT,在我们的文章中一直以来都是常驻嘉宾,不止因为NFT背后隐藏的潜力,更因为在这个NFT世界里冥冥之中仿佛有一双幕后的手,OpenSea、库里、ERC115、视觉中国、
  • 区块链产业人才发展报告

    工业和信息化部作为工业和信息化行业主管部门,正在着力推进“两个强国”建设,加快推动以区块链为代表的新兴技术与实体经济深度融合。我国区块链技术和应用想要
  • 冰墩墩的NFT暴涨千倍?真相则是价格暴跌、成交遇冷

    《区块链日报》记者查证,近日来冰墩墩数字藏品交易数量出现大幅下滑,而所谓的暴涨千倍更是有价无市的自嗨。昨日,北京冬奥会正式闭幕。在这届冬奥会上,吉祥物“冰
  • 2021年中国元宇宙行业用户行为分析热点报告

    元宇宙网络热度高涨,中国网民对虚拟生态兴趣浓厚。艾媒咨询数据显示,超六成的网民对“元宇宙”了解程度较高,在元宇宙较基础的游戏领域,超九成的人对VR游戏更感兴
  • 就业年龄歧视如何解决?来Web3看看

    上周,我突然想到我的第一份工作实际上是在为一家失败的航空公司制定破产退出计划,那年我们的协议实习生刚出生。在一阵恐慌后,我又花了一点时间反思我这个拥有近1
  • 元宇宙+剧本杀:“在异世界里当演员”

    你玩过剧本杀吗?体验过“元宇宙+剧本杀”吗?2月,恒信东方推出了一款次时代剧本杀原创作品——《失落的王朝》。其剧本和线索以数字化资产打造,通过VR技术塑造了与
  • 从概念到落地 Web3.0初具雏形

    加密资产热潮催生出的链上应用中,除了DeFi、NFT、链游GameFi等场景外,还有一个热词叫「Web3.0」。Web3.0的概念最早出现在2014年,由以太坊联合创始人及波卡创建者
  • 76亿美金估值、2022年最具创新力公司,Dapper Labs如何做到?

    “元宇宙的开拓者”是我们针对元宇宙的发展而设立的专栏,主要面向那些深挖元宇宙产业或者在元宇宙进行“淘金”的从业者,分享这些企业或者创业者们的故事,以独特
Top