当前位置:首页 > 科技  > 网络

国产AI大模型高考成绩单出炉:讯飞星火获得综合第一

来源: 责编: 时间:2024-06-11 17:48:25 65观看
导读 快科技6月11日消息,随着今年高考的结束,一场前所未有的“智能竞赛”也在幕后悄然展开。今年的高考战场上,一支非传统但引人注目的队伍——国产人工智能大模型,吸引了广泛关注。近日,搜狐科

快科技6月11日消息,随着今年高考的结束,一场前所未有的“智能竞赛”也在幕后悄然展开。今年的高考战场上,一支非传统但引人注目的队伍——国产人工智能大模型,吸引了广泛关注。ZSd28资讯网——每日最新资讯28at.com

近日,搜狐科技、量子位等十余家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的全面评测,并公布了令人瞩目的成绩。ZSd28资讯网——每日最新资讯28at.com

国产AI大模型高考成绩单出炉:讯飞星火获得综合第一ZSd28资讯网——每日最新资讯28at.com

首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为权威专家为各大模型的作文打分。腾讯元宝和百度文心一言以超过50分的成绩位居前列,智谱清言、字节豆包与讯飞星火则并列第三。Kimi、阿里通义、百川、海螺排名相对靠后。ZSd28资讯网——每日最新资讯28at.com

而在潇湘晨报的“AI写作”评测中,讯飞星火不仅平均分位居首位,且获得了全场高分56分。潇湘晨报邀请湖南知名作家、编辑作为阅卷老师,对国内五大AI大模型产品——百度文心一言、讯飞星火、阿里通义千问、字节豆包、腾讯元宝的高考作文进行评分,经过四位阅卷老师的综合打分,讯飞星火以49分的平均分高居首位。ZSd28资讯网——每日最新资讯28at.com

国产AI大模型高考成绩单出炉:讯飞星火获得综合第一ZSd28资讯网——每日最新资讯28at.com

给讯飞星火打出“全场高分”56分的阅卷老师表示:“本文观点清晰,论述集中且层层推进,很多句子都简洁有力,颇有思想性。如果是某个学生写的,无疑是难得的佳作。”ZSd28资讯网——每日最新资讯28at.com

接下来是数学科目的较量。在搜狐科技的数学评测中,讯飞星火、文心一言、豆包均以63%的正确率位列第一梯队,智谱清言、阿里通义则以50%的正确率位居第二梯队,其他大模型相对落后。ZSd28资讯网——每日最新资讯28at.com

国产AI大模型高考成绩单出炉:讯飞星火获得综合第一ZSd28资讯网——每日最新资讯28at.com

在量子位的高考数学评测中,虽然没有给出详细成绩单,但展示了各家大模型详细的解题思路,交由网友打分,通过网友的投票打分可以看出,讯飞星火的“识图+解数学题”能力收到了高认可,位居其后的分别是Kimi、通义千问、文心一言、豆包等。ZSd28资讯网——每日最新资讯28at.com

国产AI大模型高考成绩单出炉:讯飞星火获得综合第一ZSd28资讯网——每日最新资讯28at.com

后是高考物理的测试。在量子位的评测中,阿里通义千问与讯飞星火以71.4%的准确率高居第一梯队,而Kimi、海螺和腾讯元宝则以42.9%的准确率位于第二梯队。百川百小应和万知答对一题位于第三梯队。ZSd28资讯网——每日最新资讯28at.com

文心一言、豆包、天工、智谱清言、商量因为出现了不同程度读图失败的问题,在成功识别的题目中,商量和文心一言的正确率为2/4,即正确率为28.6%;豆包、天工、智谱清言正确率为1/2,即正确率为14.3%。ZSd28资讯网——每日最新资讯28at.com

国产AI大模型高考成绩单出炉:讯飞星火获得综合第一ZSd28资讯网——每日最新资讯28at.com

综合以上媒体在作文、数学、物理三门科目的成绩,我们得出了2024年人工智能大模型高考“成绩单”。来自科大讯飞的讯飞星火以52.49分高居第一名,通义千问、文心一言分别位列第二、第三名,而Kimi、字节豆包、海螺AI等其他大模型也有不错的表现。ZSd28资讯网——每日最新资讯28at.com

综合成绩:ZSd28资讯网——每日最新资讯28at.com

第一名:52.49 讯飞星火ZSd28资讯网——每日最新资讯28at.com

第二名:46.08 通义千问ZSd28资讯网——每日最新资讯28at.com

第三名:37.67 文心一言ZSd28资讯网——每日最新资讯28at.com

第四名:34.68  KimiZSd28资讯网——每日最新资讯28at.com

第五名:33.57 字节豆包ZSd28资讯网——每日最新资讯28at.com

第六名:31.92 海螺AIZSd28资讯网——每日最新资讯28at.com

第七名:30.61 腾讯元宝ZSd28资讯网——每日最新资讯28at.com

第八名:30.28 智谱清言ZSd28资讯网——每日最新资讯28at.com

第九名:21.56 百川百小应ZSd28资讯网——每日最新资讯28at.com

国产AI大模型高考成绩单出炉:讯飞星火获得综合第一ZSd28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-17-93025-0.html国产AI大模型高考成绩单出炉:讯飞星火获得综合第一

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 坏消息假期结束:好消息只上4天

下一篇: 国产大作《黑神话:悟空》免费送!七彩虹游戏本618福利加码

标签:
  • 热门焦点
  • 卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    在今天的Redmi后性能时代战略发布会结束之后,Redmi总经理卢伟冰又带来了一篇长文,详解了为什么 Redmi 要开启后性能时代?为什么选择和 MediaTek、Pixelworks 深度合作?以及后性
  • 6月安卓手机性能榜:vivo/iQOO霸占旗舰排行榜前三

    6月安卓手机性能榜:vivo/iQOO霸占旗舰排行榜前三

    2023年上半年已经正式过去了,我们也迎来了安兔兔V10版本,在新的骁龙8Gen3和天玑9300发布之前,性能榜的榜单大体会以骁龙8Gen2和天玑9200+为主,至于那颗3.36GHz的骁龙8Gen2领先
  • 5月iOS设备好评榜:iPhone 14仅排第43?

    5月iOS设备好评榜:iPhone 14仅排第43?

    来到新的一月,安兔兔的各个榜单又重新汇总了数据,像安卓阵营的榜单都有着比较大的变动,不过iOS由于设备的更新换代并没有那么快,所以相对来说变化并不大,特别是iOS好评榜,老款设
  • 企业采用CRM系统的11个好处

    企业采用CRM系统的11个好处

    客户关系管理(CRM)软件可以为企业提供很多的好处,从客户保留到提高生产力。  CRM软件用于企业收集客户互动,以改善客户体验和满意度。  CRM软件市场规模如今超过580
  • 慕岩炮轰抖音,百合网今何在?

    慕岩炮轰抖音,百合网今何在?

    来源:价值研究所 作者:Hernanderz“难道就因为自己的一个产品牛逼了,从客服到总裁,都不愿意正视自己产品和运营上的问题,选择逃避了吗?”这一番话,出自百合网联合创
  • 2天涨粉255万,又一赛道在抖音爆火

    2天涨粉255万,又一赛道在抖音爆火

    来源:运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁这个暑期,旅游赛道彻底火了:有的「地方」火了——贵州村超旅游收入 1 个月超过 12 亿;有的「博主」火了&m
  • 年轻人的“职场羞耻感”,无处不在

    年轻人的“职场羞耻感”,无处不在

    作者:冯晓亭 陶 淘 李 欣 张 琳 马舒叶来源:燃次元“人在职场,应该选择什么样的着装?”近日,在网络上,一个与着装相关的帖子引发关注,在该帖子里,一位在高级写字楼亚洲金
  • OPPO K11搭载高性能石墨散热系统:旗舰同款 性能凉爽释放

    OPPO K11搭载高性能石墨散热系统:旗舰同款 性能凉爽释放

    日前OPPO官方宣布,将于7月25日14:30举办新品发布会,届时全新的OPPO K11将正式与大家见面,将主打旗舰影像,和同档位竞品相比,其最大的卖点就是将配备索尼
  • 外交部:美方应停止在网络安全问题上不负责任地指责他国

    外交部:美方应停止在网络安全问题上不负责任地指责他国

      中国外交部今天(16日)举行例行记者会。会上,有记者问,美国情报官员称,他们正在阻拦来自中国以及其他国家的黑客获取相关科研成果。 中方对此有何评论?对此
Top