当前位置:首页 > 科技  > 网络

七大模型全部高考分数出炉:文科能上一本、理科好是二本

来源: 责编: 时间:2024-07-19 07:54:28 652观看
导读 快科技7月18日消息,日前由上海人工智能实验室旗下司南评测体系OpenCompass,对7个AI大模型进行了高考9个科目的全科目测试,从而能全面评测大模型实力。此次参与测试的模型分别来自阿里巴巴、零一万物、智谱AI、

快科技7月18日消息,日前由上海人工智能实验室旗下司南评测体系OpenCompass,对7个AI大模型进行了高考9个科目的全科目测试,从而能全面评测大模型实力。n0n28资讯网——每日最新资讯28at.com

此次参与测试的模型分别来自阿里巴巴、零一万物、智谱AI、上海人工智能实验室&商汤、法国Mistral的开源模型,以及OpenAI的闭源模型GPT-4o。n0n28资讯网——每日最新资讯28at.com

七大模型全部高考分数出炉:文科能上一本、理科好是二本n0n28资讯网——每日最新资讯28at.com

以参加高考人数多的河南省分数线作为参考,文科成绩好的AI模型能够达到一本线,而理科成绩好的模型则只能上二本。n0n28资讯网——每日最新资讯28at.com

七大模型全部高考分数出炉:文科能上一本、理科好是二本n0n28资讯网——每日最新资讯28at.com

文科状元由阿里通义千问大模型以546分的成绩夺得,而理科状元则是上海人工智能实验室&商汤联合研发的浦语文曲星,得分为468.5分。n0n28资讯网——每日最新资讯28at.com

OpenAI的GPT-4o在文科上得分531分,排名第三,理科得分为467分,排名第二。n0n28资讯网——每日最新资讯28at.com

在评测中,AI在文科科目如语文、历史、地理、思想政治等科目上展现了深厚的知识储备和理解能力,但在理科科目中,数理推理能力普遍存在短板。n0n28资讯网——每日最新资讯28at.com

特别是在面对带图题目时,得分率仅有37.64%,显示出在图片理解和运用能力方面,所有大模型均存在较大提升空间。n0n28资讯网——每日最新资讯28at.com

七大模型全部高考分数出炉:文科能上一本、理科好是二本n0n28资讯网——每日最新资讯28at.com

阅卷老师指出,尽管大模型在基础知识掌握上表现出色,但在逻辑推理和知识灵活应用方面仍有较大差距。n0n28资讯网——每日最新资讯28at.com

例如在作答主观题时,大模型常常无法完整理解题干,导致答非所问;在解答数学题时,解题过程机械且逻辑性差。n0n28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-17-101636-0.html七大模型全部高考分数出炉:文科能上一本、理科好是二本

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 女子带韩国老公回国实现西瓜自由:想把一年的量都吃完再走

下一篇: 巴黎奥运村就餐区一半是素食:践行环保低碳理念

标签:
  • 热门焦点
  • 直屏旗舰来了 iQOO 12和K70 Pro同台竞技

    旗舰机基本上使用的都是双曲面屏幕,这就让很多喜欢直屏的爱好者在苦等一款直屏旗舰,这次,你们等到了。据博主数码闲聊站带来的最新爆料称,Redmi下代旗舰K70 Pro和iQOO 12两款手
  • CSS单标签实现转转logo

    转转品牌升级后更新了全新的Logo,今天我们用纯CSS来实现转转的新Logo,为了有一定的挑战性,这里我们只使用一个标签实现,将最大化的使用CSS能力完成Logo的绘制与动画效果。新logo
  • 得物效率前端微应用推进过程与思考

    一、背景效率工程随着业务的发展,组织规模的扩大,越来越多的企业开始意识到协作效率对于企业团队的重要性,甚至是决定其在某个行业竞争中突围的关键,是企业长久生存的根本。得物
  • 每天一道面试题-CPU伪共享

    前言:了不起:又到了每天一到面试题的时候了!学弟,最近学习的怎么样啊 了不起学弟:最近学习的还不错,每天都在学习,每天都在进步! 了不起:那你最近学习的什么呢? 了不起学弟:最近在学习C
  • 腾讯VS网易,最卷游戏暑期档,谁能笑到最后?

    作者:无锈钵来源:财经无忌7月16日晚,上海1862时尚艺术中心。伴随着幻象的精准命中,硕大的荧幕之上,比分被定格在了14:12,被寄予厚望的EDG战队以绝对的优势战胜了BLG战队,拿下了总决
  • 超闭合精工铰链 彻底消灭缝隙 三星Galaxy Z Flip5与Galaxy Z Fold5发布

    2023年7月26日,三星电子正式发布了Galaxy Z Flip5与Galaxy Z Fold5。三星新一代折叠屏手机采用超闭合精工铰链,让折叠后的缝隙不再可见。同时,配合处
  • AI艺术欣赏体验会在上海梅赛德斯奔驰中心音乐俱乐部上演

    光影交错的镜像世界,虚实幻化的视觉奇观,虚拟偶像与真人共同主持,这些场景都出现在2019世界人工智能大会的舞台上。8月29日至31日,“AI艺术欣赏体验会”在上海
  • 利用职权私自解除被封帐号 Meta开除20多名员工

    11月18日消息,据外媒援引知情人士表示,过去一年时间内,Facebook母公司Meta解雇或处罚了20多名员工以及合同工,指控这些人通过内部系统以不当方式重置用户帐号,其
  • 中关村论坛11月25日开幕,15位诺奖级大咖将发表演讲

    11月18日,记者从2022中关村论坛新闻发布会上获悉,中关村论坛将于11月25至30日在京举行。本届中关村论坛由科学技术部、国家发展改革委、工业和信息化部、国务
Top