当前位置:首页 > 科技  > 手机

小米开源声音理解大模型MiDashengLM-7B,22项评测刷新SOTA记录

来源: 责编: 时间:2025-08-05 09:21:54 153观看
导读小米公司近期宣布了一项重大技术进展,正式开源了其声音理解大模型MiDashengLM-7B。这一模型在多模态大模型领域取得了显著成就,刷新了22个公开评测集上的最佳成绩(SOTA),并展示了业界领先的推理效率和数据吞吐能力。MiDash

小米公司近期宣布了一项重大技术进展,正式开源了其声音理解大模型MiDashengLM-7B。这一模型在多模态大模型领域取得了显著成就,刷新了22个公开评测集上的最佳成绩(SOTA),并展示了业界领先的推理效率和数据吞吐能力。VDU28资讯网——每日最新资讯28at.com

MiDashengLM-7B的构建基于Xiaomi Dasheng音频编码器和Qwen2.5-Omni-7B Thinker自回归解码器,通过创新的通用音频描述训练策略,实现了对语音、环境声音及音乐的统一理解。这一能力使得模型不仅能准确捕捉并分析声音内容,还能理解其背后的情境与情感,提升了全场景智能生态的用户体验。VDU28资讯网——每日最新资讯28at.com

VDU28资讯网——每日最新资讯28at.com

据悉,小米于2024年首次推出了Xiaomi Dasheng声音基座模型,而此次开源的7B模型是对该基座模型的扩展与升级。目前,该系列模型已在小米智能家居、汽车座舱等多个领域实现了超过30个应用场景的落地。VDU28资讯网——每日最新资讯28at.com

在性能表现上,MiDashengLM-7B在音频描述、声音理解、音频问答等多个任务中展现出了明显的优势。特别是在音频描述任务中,其性能超越了Qwen和Kimi等同类7B模型。在声音理解任务中,MiDashengLM-7B也仅在少数项目上略微落后于Kimi的7B模型,整体表现领先。VDU28资讯网——每日最新资讯28at.com

除了卓越的性能表现,MiDashengLM-7B在推理效率上也实现了显著提升。在单个样本推理的情形下,其首个token预测时间(TTFT)仅为Qwen2.5-Omni-7B的1/4。同时,在批次处理时,MiDashengLM-7B能够在80GB GPU上处理更大的batch size,而不会出现显存溢出的问题,从而提高了数据吞吐效率。VDU28资讯网——每日最新资讯28at.com

MiDashengLM-7B还采用了创新的训练范式,即通用音频描述对齐范式。这一范式避免了传统ASR转录数据对齐方法的局限性,能够捕捉说话人的情感、空间混响等关键声学特征,迫使模型学习音频场景的深层语义关联。这一方法的引入,使得模型能够利用几乎所有的数据,包括噪声或非语音内容,从而提高了数据利用率和模型性能。VDU28资讯网——每日最新资讯28at.com

小米表示,音频理解是构建全场景智能生态的关键领域之一。MiDashengLM-7B的推出,将进一步提升小米设备在自然语言交互方面的体验,从智能家居、智能汽车到智能手机等各个领域都能受益。未来,小米将继续致力于AI大模型领域的研究和创新,为用户提供更加智能、便捷的服务。VDU28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-175643-0.html小米开源声音理解大模型MiDashengLM-7B,22项评测刷新SOTA记录

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OPPO Find X9 Ultra或配1.5K直屏,SM8850超大杯机型测试进展曝光

下一篇: iOS 18.6续航实测:iPhone 15系列续航提升明显,值得升级

标签:
  • 热门焦点
  • 一年经验在二线城市面试后端的经验分享

    忠告这篇文章只适合2年内工作经验、甚至没有工作经验的朋友阅读。如果你是2年以上工作经验,请果断划走,对你没啥帮助~主人公这篇文章内容来自 「升职加薪」星球星友 的投稿,坐
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 本地生活这块肥肉,拼多多也想吃一口

    出品/壹览商业 作者/李彦编辑/木鱼拼多多也看上本地生活这块蛋糕了。近期,拼多多在App首页“充值中心”入口上线了本机生活界面。壹览商业发现,该界面目前主要
  • 新电商三兄弟,“抖快红”成团!

    来源:价值研究所作 者:Hernanderz 随着内容电商的概念兴起,抖音、快手、小红书组成的“新电商三兄弟”成为业内一股不可忽视的势力,给阿里、京东、拼多多带去了巨大压
  • 花7万退货退款无门:谁在纵容淘宝珠宝商家造假?

    来源:极点商业作者:杨铭在淘宝购买珠宝玉石后,因为保证金不够赔付,店铺关闭,退货退款难、维权无门的比比皆是。“提供相关产品鉴定证书,支持全国复检,可以30天无理由退换货。&
  • 一条抖音4亿人围观 ! 这家MCN比无忧传媒还野

    作者:Hiu 来源:互联网品牌官01 擦边少女空降热搜,幕后推手曝光被网友誉为“纯欲天花板”的女网红井川里予,近期因为一组哥特风照片登上热搜,引发了一场互联网世界关于
  • 支持aptX Lossless无损传输 iQOO TWS 1赛道版发布限时优惠价369元

    2023年7月4日,“无损音质,声动人心”iQOO TWS 1正式发布,支持aptX Lossless无损传输,限时优惠价369元。iQOO TWS 1耳机率先支持端到端aptX Lossless无
  • 与兆芯合作 联想推出全新旗舰版笔记本电脑开天N7系列

    联想与兆芯合作推出全新联想旗舰版笔记本电脑开天 N7系列。这个系列采用兆芯KX-6640MA处理器平台,KX-6640MA 处理器是采用了陆家嘴架构,16nm 工艺,4 核 4 线
  • “买真退假” 这种“羊毛”不能薅

    □ 法治日报 记者 王春   □ 本报通讯员 胡佳丽  2020年初,还在上大学的小东加入了一个大学生兼职QQ群。群主“七王”在群里介绍一些刷单赚
Top