当前位置:首页 > 科技  > 芯片

小米首次曝光AI大模型MiLM-6B,评测榜单排名第十

来源: 责编: 时间:2023-08-14 22:01:40 548观看
导读电子工程专辑讯此前小米公布2023Q1财报时,卢伟冰曾指出,小米不会像OpenAI公司那样去做通用大模型,会跟公司的业务相结合,通过技术转化为业务成果。小米对AI大模型的态度也是持开放状态,有可能引进第三方来帮助发展。近日,小

电子工程专辑讯此前小米公布2023Q1财报时,卢伟冰曾指出,小米不会像OpenAI公司那样去做通用大模型,会跟公司的业务相结合,通过技术转化为业务成果。小米对AI大模型的态度也是持开放状态,有可能引进第三方来帮助发展。kXZ28资讯网——每日最新资讯28at.com


近日,小米来自大模型评测平台的C-Eval、CMMLU的数据评分被曝光,引发谈论。AI概念这段时间的“风声”很大,小米偷偷发力AI大模型的进展到什么程度了?kXZ28资讯网——每日最新资讯28at.com


小米在Github是这样介绍MiLM-6B:MiLM-6B是由小米开发的一个大规模预训练语言模型,参数规模为64亿。在C-Eval和CMMLU上均取得同尺寸最好的效果。kXZ28资讯网——每日最新资讯28at.com


在得分方面,在C-Eval评估中,MiLM-6B的平均分为60.2,总榜单排名第10、同参数量级排名第1。在CMMLU评估中,MiLM-6B在Five-shot和Zero-shot测试中的平均分分别为57.17和60.37。kXZ28资讯网——每日最新资讯28at.com


根据C-Eval给出的信息,MiLM-6B模型在具体各科目成绩上,在STEM(科学、技术、工程和数学教育)全部20个科目中,计量师、物理、化学、生物等多个项目获得了较高的准确率。不过在“法学、数学、编程、概率论、离散数学”等涉及“抽象思维”的科目中,还有一定进步空间。在人文科学的11个科目中,MiLM-6B则在“历史与法律”基础上有着不错的准确率表现。kXZ28资讯网——每日最新资讯28at.com


kXZ28资讯网——每日最新资讯28at.com


“CMMLU”是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力。CMMLU涵盖了从基础学科到高级专业水平的67个主题。它包括:需要计算和推理的自然科学,需要知识的人文科学和社会科学,以及需要生活常识的中国驾驶规则等。此外,CMMLU中的许多任务具有中国特定的答案,可能在其他地区或语言中并不普遍适用。因此是一个完全中国化的中文测试基准。kXZ28资讯网——每日最新资讯28at.com


“C-Eval”是由上海交通大学、清华大学、爱丁堡大学共同构建的一个针对基础模型的综合中文评估套件。它由13948道多项选择题组成,涵盖52个不同学科和四个难度级别,覆盖人文、社科、理工,及其他专业四个大方向,用以帮助中文社区研发大模型。kXZ28资讯网——每日最新资讯28at.com


据悉,目前小米在大模型团队方面的主力团队有30多人,按照人才、数据、模型、算力、评测、产品这几个方面进行筹备,不会扩张的太快。小米把“AI实验室”比喻成集团层面AI技术的“试验田”和“弹药库”,如果AI发展迅速,AI实验室会研发一些中长期的前沿技术,围绕小米业务做储备,在集团需要的时候输出“弹药”。kXZ28资讯网——每日最新资讯28at.com


AI的发展速度究竟会有多快或者多慢,其实很难评判。就比如OpenAI推出的ChatGPT,一夜之间就让沉淀的AI技术发生井喷式发展,但现在AI技术还在找一个能真正落地的应用场景。小米的大模型也将在未来丰富其业务发展,比如小米的小爱同学、手机操作系统MIUI、汽车的座舱、IoT、机器人,都是应用大模型的典型场景。kXZ28资讯网——每日最新资讯28at.com


而且小米现在研发的AI大模型也是有侧重点的,更多侧重在语言大模型上,去丰富提升小爱同学的理解能力、智能家居指令的识别能力等。至于通过大模型来实现智能家居的自动组网、个性化的家居体验,至少小米AI实验室没有在做。kXZ28资讯网——每日最新资讯28at.com


责编:Amy.wu
<

本文链接:http://www.28at.com/showinfo-27-5635-0.html小米首次曝光AI大模型MiLM-6B,评测榜单排名第十

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 伸缩滑轨于工业自动化中如何提高生产系统的性能

下一篇: 三星电子预告256TB SSD:基于 3D QLC

标签:
  • 热门焦点
  • Find N3入网:最高支持16+1TB

    OPPO将于近期登场的Find N3折叠屏目前已经正式入网,型号为PHN110。本次Find N3在外观方面相比前两代有很大的变化,不再是小号的横向折叠屏,而是跟别的厂商一样采用了较为常见的
  • 小米降噪蓝牙耳机Necklace分享:听一首歌 读懂一个故事

    在今天下午的小米Civi 2新品发布会上,小米还带来了一款新的降噪蓝牙耳机Necklace,我们也在发布结束的第一时间给大家带来这款耳机的简单分享。现在大家能见到最多的蓝牙耳机
  • 把LangChain跑起来的三个方法

    使用LangChain开发LLM应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习LLM模型的应用,对Langchain进行快速上手?本片讲解3个把LangChain跑起来
  • 在线图片编辑器,支持PSD解析、AI抠图等

    自从我上次分享一个人开发仿造稿定设计的图片编辑器到现在,不知不觉已过去一年时间了,期间我经历了裁员失业、面试找工作碰壁,寒冬下一直没有很好地履行计划.....这些就放在日
  • 从零到英雄:高并发与性能优化的神奇之旅

    作者 | 波哥审校 | 重楼作为公司的架构师或者程序员,你是否曾经为公司的系统在面对高并发和性能瓶颈时感到手足无措或者焦头烂额呢?笔者在出道那会为此是吃尽了苦头的,不过也得
  • 雅柏威士忌多款单品价格大跌,泥煤顶流也不香了?

    来源 | 烈酒商业观察编 | 肖海林今年以来,威士忌市场开始出现了降温迹象,越来越多不断暴涨的网红威士忌也开始悄然回归市场理性。近日,LVMH集团旗下苏格兰威士忌品牌雅柏(Ardbeg
  • 2天涨粉255万,又一赛道在抖音爆火

    来源:运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁这个暑期,旅游赛道彻底火了:有的「地方」火了&mdash;&mdash;贵州村超旅游收入 1 个月超过 12 亿;有的「博主」火了&m
  • 半导体需求下滑 三星电子DS业务部门今年营业亏损预计超10万亿韩元

    7月17日消息,据外媒报道,去年下半年开始的半导体需求下滑,影响到了三星电子、SK海力士、英特尔等诸多厂商,营收明显下滑,部分厂商甚至出现了亏损。作为
  • OPPO K11采用全方位护眼屏:三大护眼能力减轻视觉疲劳

    日前OPPO官方宣布,全新的OPPO K11将于7月25日正式发布,将主打旗舰影像,和同档位竞品相比,其最大的卖点就是将配备索尼IMX890主摄,堪称是2000档位影像表
Top