当前位置:首页 > 科技  > 网络

七大模型全部高考分数出炉:文科能上一本、理科好是二本

来源: 责编: 时间:2024-07-19 16:36:09 451观看
导读 快科技7月18日消息,日前由上海人工智能实验室旗下司南评测体系OpenCompass,对7个AI大模型进行了高考9个科目的全科目测试,从而能全面评测大模型实力。此次参与测试的模型分别来自阿里巴巴、零一万物、智谱AI、

快科技7月18日消息,日前由上海人工智能实验室旗下司南评测体系OpenCompass,对7个AI大模型进行了高考9个科目的全科目测试,从而能全面评测大模型实力。C8n28资讯网——每日最新资讯28at.com

此次参与测试的模型分别来自阿里巴巴、零一万物、智谱AI、上海人工智能实验室&商汤、法国Mistral的开源模型,以及OpenAI的闭源模型GPT-4o。C8n28资讯网——每日最新资讯28at.com

七大模型全部高考分数出炉:文科能上一本、理科好是二本C8n28资讯网——每日最新资讯28at.com

以参加高考人数多的河南省分数线作为参考,文科成绩好的AI模型能够达到一本线,而理科成绩好的模型则只能上二本。C8n28资讯网——每日最新资讯28at.com

七大模型全部高考分数出炉:文科能上一本、理科好是二本C8n28资讯网——每日最新资讯28at.com

文科状元由阿里通义千问大模型以546分的成绩夺得,而理科状元则是上海人工智能实验室&商汤联合研发的浦语文曲星,得分为468.5分。C8n28资讯网——每日最新资讯28at.com

OpenAI的GPT-4o在文科上得分531分,排名第三,理科得分为467分,排名第二。C8n28资讯网——每日最新资讯28at.com

在评测中,AI在文科科目如语文、历史、地理、思想政治等科目上展现了深厚的知识储备和理解能力,但在理科科目中,数理推理能力普遍存在短板。C8n28资讯网——每日最新资讯28at.com

特别是在面对带图题目时,得分率仅有37.64%,显示出在图片理解和运用能力方面,所有大模型均存在较大提升空间。C8n28资讯网——每日最新资讯28at.com

七大模型全部高考分数出炉:文科能上一本、理科好是二本C8n28资讯网——每日最新资讯28at.com

阅卷老师指出,尽管大模型在基础知识掌握上表现出色,但在逻辑推理和知识灵活应用方面仍有较大差距。C8n28资讯网——每日最新资讯28at.com

例如在作答主观题时,大模型常常无法完整理解题干,导致答非所问;在解答数学题时,解题过程机械且逻辑性差。C8n28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-17-101805-0.html七大模型全部高考分数出炉:文科能上一本、理科好是二本

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 美国又在芯片封锁下狠手:建造封装供应链 更好封锁中国厂商等!

下一篇: 微软蓝屏故障后航空公司逐步复飞:航司可能面临巨额赔偿

标签:
  • 热门焦点
Top