当前位置：首页 > 元宇宙 > AI

从 DeepSeek 火热，到李飞飞团队新成果，“幕后高手”竟是它

来源：责编：时间：2025-02-08 12:16:04 210观看

导读最近 AI 大模型领域可以说是热点话题不断，DeepSeek 的热潮还未消退，国内李飞飞团队提出的一种模型训练新方法又在行业里引发热议。具体来说，他们以阿里云通义千问 Qwen2.5-32B-Instruct 开源模型为底座，在 16 块

最近 AI 大模型领域可以说是热点话题不断，DeepSeek 的热潮还未消退，国内李飞飞团队提出的一种模型训练新方法又在行业里引发热议。

具体来说，他们以阿里云通义千问 Qwen2.5-32B-Instruct 开源模型为底座，在 16 块 H100 GPU 上进行监督微调，仅用时 26 分钟便训练出了新模型 s1-32B。令人惊叹的是，该模型在数学及编码能力上取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型相当的效果，甚至在竞赛数学问题上的表现比 o1-preview 高出 27%。

同时值得关注的是，DeepSeek 早在之前也曾透露，将 DeepSeek-R1 的推理能力蒸馏 6 个模型开源给社区，其中 4 个模型正是基于 Qwen 开发的。基于 Qwen-32B 蒸馏的模型，在多项能力上实现了对标 OpenAI o1-mini 的效果。

这表明，Qwen 模型不仅能够满足顶尖团队对模型性能的高要求，还能为不同团队提供多样化的开发路径，助力他们在各自的研究方向上取得突破。

一时间，在开源社区备受追捧的通义千问 Qwen 模型，因这一轮推理模型技术新浪潮又一次成为大家关注的焦点。

李飞飞团队与 DeepSeek 纷纷选择 Qwen 作为基座模型，已经足以引发业界的关注和广泛讨论，而这一现象背后，不仅是 Qwen 模型自身强大的性能与独特优势的体现，更是开源理念推动技术进步的生动案例。

那么 Qwen 模型究竟强在哪里？又为什么如此受到热捧呢？认为主要有以下几点原因。

首先，是阿里云 Qwen 模型具有强劲的性能优势。

据了解，阿里云通义千问 Qwen 模型自 2023 年 8 月起相继开源了 Qwen、Qwen1.5、Qwen2、Qwen2.5 等 4 代模型，涵盖了大语言模型、多模态模型、数学模型和代码模型等数十款。这些模型在全球多个权威榜单上屡次斩获“全球开源冠军”，性能全球领先。

例如，在 HuggingFace 的 Open LLM Leaderboard、Chatbot Arena 大模型盲测榜单、司南 OpenCompass 等多个国内外知名榜单上，Qwen 模型都展现出了卓越的实力。其强大的性能为开发者提供了坚实的基础，使得基于 Qwen 开发的模型能够在各种应用场景中表现出色。

除了强劲的性能，Qwen 模型的开源策略也是是其受到广泛欢迎的重要原因之一。

要知道，阿里云率先实现了“全尺寸、全模态、多场景”的开源，从 1.5B 到 72B 乃至 110B，Qwen 开源的模型尺寸及版本覆盖面最广。这种多样化的选择为开发者和企业提供了极大的便利，无论是小型项目还是大规模应用，都能找到适合的 Qwen 模型版本。2024 年，仅 Qwen2.5-1.5B-Instruct 这款模型，就占到了全球模型下载量的 26.6%，远高于第二名 Llama-3.1-8B-Instruct-GGUF 的 6.44%。同时仅视觉理解 Qwen-VL 及 Qwen2-VL 两款模型，全球下载量就突破 3200 万次，一周前，Qwen2.5-VL 全新升级，又引发新一轮开源社区狂热。这充分说明了 Qwen 模型在开源社区中的受欢迎程度。

第三点，Qwen 模型的火热还得益于其庞大的衍生模型群。

截至目前，海内外开源社区中 Qwen 的衍生模型数量已突破 9 万，超越了 Llama 系列衍生模型，成为世界最大的生成式语言模型族群。这一庞大的衍生模型群不仅体现了 Qwen 模型的广泛影响力，也反映了其在技术上的可扩展性和适应性。全球 AI 模型开发者都可以基于 Qwen 进行不同技术的差异化比较，从而进一步推动了 Qwen 的火热。这种开源生态的繁荣，使得 Qwen 成为了开源社区事实上最重要的标杆基座模型。

通过以上三点的分析，我们其实已经可以得出结论：Qwen 模型性能强劲，开源尺寸多样化，并且拥有全球最大的衍生模型群，已经取代 Llama 成为开源社区事实上最重要的标杆基座模型。

总之，阿里云通义千问 Qwen 模型因其强劲的性能、开源与尺寸多样化以及庞大的衍生模型群等优势，成为了李飞飞团队和 DeepSeek 的共同选择。这不仅展示了 Qwen 模型在人工智能领域的卓越实力，也体现了开源理念在推动技术创新、促进开源生态建设和助力行业应用落地等方面的重要价值。随着人工智能技术的不断发展，我们有理由相信，Qwen 模型将继续引领开源潮流，为全球人工智能的发展贡献更多力量。

本文链接：http://www.28at.com/showinfo-45-10553-0.html从 DeepSeek 火热，到李飞飞团队新成果，“幕后高手”竟是它

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：斥 300 亿-500 亿美元巨资，法国、阿联酋将共建 AI 专用数据中心

下一篇：受谷歌 750 亿美元 AI 投资提振，英伟达股价一度涨超 5%

标签：

热门焦点

FMIFAwards奖项即将揭晓！

来源：X增强现实FMIF Awards未来元宇宙创新奖是由未来元宇宙创新论坛、ARinChina以及多家投资机构、媒体、研究院联合发起的一项评选活动。旨在推动新技术的融合与集成低成本
沉寂3年，大模型激活小度天猫精灵？

Tech星球（微信ID：tech618）文 | 何煦阳沉寂了许久的智能音箱，在今年大模型横空出世之后，又再次燃起了新的希望。 2月9日，小度宣布将融合文心一言，打造针对智能设备场景的AI模型&ldq
元宇宙里卖酸奶，好炸裂的操作！

作者 | 李东阳来源 | 首席营销官有没有发现，当下的热搜出现一个有意思的现象，那就是“情怀”不知不觉成为了主流，爷青回话题讨论性非常高。前有名侦探柯南和优衣库
【东方证券】虚拟世界照进现实，元宇宙中有什么？ | 元宇宙Meta洞见

元宇宙的表现形式大多以游戏为起点，并逐渐整合互联网、数字化娱乐、社交网络等功能，长期来看甚至可以整合社会经济与商业活动。元宇宙的发展最关键的部分在于元
“虚拟人”角斗场，基于“硬实力”下的人性平衡法则？

在打工人“反内卷”的当下，一众虚拟人却“内卷”了起来。从北京春晚虚拟人苏小妹与刘宇演绎歌舞《星河入梦》，央美毕业的虚拟人夏语冰登上央视节目《对话》，湖南
冰墩墩还能火多久？

作者：田巧云题图源自北京2022年冬奥会官方微博如果要问2022年的开年明星是谁，冰墩墩当仁不让。几乎所有人都被那个抖雪的动作实力圈粉。在社交媒体的助推，以及日
银保监会：打击以“元宇宙”为名义的违法行为

今日，银保监会发布《关于防范以“元宇宙”名义进行非法集资的风险提示》，全文如下：近期，一些不法分子蹭热点，以“元宇宙投资项目”“元宇宙链游”等名目吸收资金，涉
8个最适合艺术家发行NFT的交易市场

近年来，加密风靡全球。加密圈最令人兴奋的方面之一是它能够用于创建称为NFT 的数字资产。从 CyberKitties 到 Cyber Galleries，NFT 已成为艺术家和艺术鉴赏家的
Staking 收益翻倍？

以太坊质押可能很快就会有两倍的利润。Coinbase 估计，在 1 月份以太坊网络合并后，持有 ETH 的回报将翻倍。增长预期假设来自加密货币交易所 Coinbase 的估计是准

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

从 DeepSeek 火热，到李飞飞团队新成果，“幕后高手”竟是它

FMIFAwards奖项即将揭晓！

沉寂3年，大模型激活小度天猫精灵？

元宇宙里卖酸奶，好炸裂的操作！

【东方证券】虚拟世界照进现实，元宇宙中有什么？ | 元宇宙Meta洞见

“虚拟人”角斗场，基于“硬实力”下的人性平衡法则？

冰墩墩还能火多久？

银保监会：打击以“元宇宙”为名义的违法行为

8个最适合艺术家发行NFT的交易市场

Staking 收益翻倍？

最新推荐

《蜘蛛侠》火了，超级英雄就该这么演

文心一言排名垫底，却成为百度业绩增长杠杆

冰墩墩的NFT暴涨千倍？真相则是价格暴跌、成交遇冷

借VR产业东风，江西抢滩布局“元宇宙”

量子计算在未来能否提高区块链技术的效率

你连元宇宙都不知道吗？快来看看这四本元宇宙书籍吧

猜你喜欢

热门推荐

相关资讯