当前位置:首页 > 科技  > 软件

小米发布MoE大模型MiMo-V2-Flash,性能媲美顶尖模型,多项实测表现亮眼

来源: 责编: 时间:2025-12-18 12:45:42 54观看
导读小米今日正式发布并开源了最新一代MoE架构大模型MiMo-V2-Flash,该模型总参数规模达3090亿,激活参数150亿,在推理、编码及智能体应用场景中展现出显著优势。模型支持混合思维模式,用户可自由切换深度思考与即时响应模式,并

小米今日正式发布并开源了最新一代MoE架构大模型MiMo-V2-Flash,该模型总参数规模达3090亿,激活参数150亿,在推理、编码及智能体应用场景中展现出显著优势。模型支持混合思维模式,用户可自由切换深度思考与即时响应模式,并具备一键生成完整HTML网页的能力,可与Claude Code、Cursor等主流编码框架无缝协作。KFj28资讯网——每日最新资讯28at.com

在性能测试中,MiMo-V2-Flash与DeepSeek-V3.2形成直接竞争态势。基准数据显示,该模型在数学竞赛AIME 2025和科学知识GPQA-Diamond测试中位列开源模型前二,软件工程能力SWE验证及多语言测试中更超越所有开源竞品,性能表现与全球顶尖闭源模型持平。特别在长上下文处理方面,其性能已超越K2 Thinking模型,在SWE-Bench Verified测试中解决率达71.7%,BrowseComp搜索评估得分45.4,配合上下文管理后提升至58.3。KFj28资讯网——每日最新资讯28at.com

技术架构层面,模型采用全局注意力(GA)与滑动窗口注意力(SWA)的1:5混合结构,既保持了线性注意力的计算效率,又显著提升了长文本处理能力。创新引入的多词元预测(MTP)训练技术,通过同步生成多个候选token并并行验证的方式,使解码吞吐量提升2-2.6倍。后训练阶段采用的多教师在线策略蒸馏(MOPD)方法,仅需传统方法1/50的计算资源即可达成同等优化效果,形成"教学-学习"闭环迭代机制。KFj28资讯网——每日最新资讯28at.com

实际场景测试验证了模型的多样化能力:在网页开发任务中,可生成包含商品轮播、规格选择等功能的电商页面,以及支持手势交互的3D圣诞树应用;在创意生成方面,能创作忧郁爱情故事和非虚构社会观察作品;智能体交互测试中,既可解答"是否服用长生不老药"等哲学问题,也能编写科幻悬疑剧本。不过实测发现,部分复杂交互场景(如教育类太阳系探索器)仍存在稳定性问题,需多次生成才能达到预期效果。KFj28资讯网——每日最新资讯28at.com

该模型已实现全面开源,推理代码完整贡献至开发者社区SGLang,API服务开启限时免费体验。技术文档显示,在Prefill单机吞吐50000 toks/s条件下,16K上下文长度的解码吞吐量达5000-15000 toks/s,单请求吞吐量151-115 toks/s。价格策略方面,输入token单价0.7元/百万,输出token单价2.1元/百万,显著低于行业平均水平。KFj28资讯网——每日最新资讯28at.com

此次发布标志着小米大模型研发进入快车道。集团近期宣布将AI与现实世界深度结合列为未来十年核心战略,AI业务投入连续四个季度环比增长超50%。为加速技术突破,小米同步启动全球人才招募计划,设立千万元级岗位薪酬,重点引进大模型领域顶尖人才。技术团队近三个月已密集发布多篇学术论文,并陆续开源多个预训练模型,构建起完整的技术生态体系。KFj28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-188346-0.html小米发布MoE大模型MiMo-V2-Flash,性能媲美顶尖模型,多项实测表现亮眼

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 罗福莉小米首秀揭秘:MiMo-V2-Flash模型如何以高效结构实现推理加速

下一篇: 95后天才少女罗福莉首登小米演讲台,揭秘MiMo大模型及团队发展新路径

标签:
  • 热门焦点
  • vivo TWS Air开箱体验:真轻 臻好听

    在vivo S15系列新机的发布会上,vivo的最新款真无线蓝牙耳机vivo TWS Air也一同发布,本次就这款耳机新品给大家带来一个简单的分享。外包装盒上,vivo TWS Air保持了vivo自家产
  • 5月安卓手机好评榜:魅族20 Pro夺冠

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年5月1日至5月31日,仅限国内市场。第一名:魅族20 Pro好评率:97.50%不得不感慨魅族老品牌还
  • Automa-通过连接块来自动化你的浏览器

    1、前言通过浏览器插件可实现自动化脚本的录制与编写,具有代表性的工具就是:Selenium IDE、Katalon Recorder,对于简单的业务来说可快速实现自动化的上手工作。Selenium IDEKat
  • 十个简单但很有用的Python装饰器

    装饰器(Decorators)是Python中一种强大而灵活的功能,用于修改或增强函数或类的行为。装饰器本质上是一个函数,它接受另一个函数或类作为参数,并返回一个新的函数或类。它们通常用
  • JavaScript学习 -AES加密算法

    引言在当今数字化时代,前端应用程序扮演着重要角色,用户的敏感数据经常在前端进行加密和解密操作。然而,这样的操作在网络传输和存储中可能会受到恶意攻击的威胁。为了确保数据
  • 半导体需求下滑 三星电子DS业务部门今年营业亏损预计超10万亿韩元

    7月17日消息,据外媒报道,去年下半年开始的半导体需求下滑,影响到了三星电子、SK海力士、英特尔等诸多厂商,营收明显下滑,部分厂商甚至出现了亏损。作为
  • 到手价3099元起!iQOO Neo8 Pro今日首销:安卓性能最强旗舰

    5月23日,iQOO如期举行了新品发布会,全新的iQOO Neo8系列也正式与大家见面,包含iQOO Neo8和iQOO Neo8 Pro两个版本,其中标准版搭载高通骁龙8+,而Pro版更
  • iQOO Neo8系列新品发布会

    旗舰双芯 更强更Pro
  • 滴滴违法违规被罚80.26亿 共存在16项违法事实

    滴滴违法违规被罚80.26亿 存在16项违法事实开始于2121年7月,历经一年时间,网络安全审查办公室对“滴滴出行”网络安全审查终于有了一个暂时的结束。据“网信
Top