当前位置：首页 > 元宇宙 > AI

AI高考大考：DeepSeek、讯飞星火领跑，数学能力谁更强？

来源：责编：时间：2025-06-09 09:38:58 187观看

导读在2025年高考数学科目考试结束后，网络上关于试卷难度的讨论热度不减。作为科技领域的观察者，我们不禁好奇，对于当前备受瞩目的AI技术而言，这份数学试卷是否同样具有挑战性？为了回答这个问题，我们组织了一场特别的“考试”，邀

在2025年高考数学科目考试结束后，网络上关于试卷难度的讨论热度不减。作为科技领域的观察者，我们不禁好奇，对于当前备受瞩目的AI技术而言，这份数学试卷是否同样具有挑战性？为了回答这个问题，我们组织了一场特别的“考试”，邀请了多家知名的大模型参与，模拟完成了一套高考数学试卷。

本次“考试”中，我们挑选了以下几家具有代表性的大模型作为“考生”：DeepSeek R1 0528、通义千问 Qwen3-235B-A22B、讯飞星火 X1-0420、豆包 Seed-Thinking-v1.5、文心 X1 Turbo、腾讯混元 Hunyuan T1 latest和GPT o3。由于网络流传的试题版本不一，我们通过多版本交叉验证和教师解题验证的方式，确保评测的准确性，试卷总分为150分。

我们特别邀请了一位拥有十年高中数学教研经验的专家汪鹏老师，对大模型的答案进行评分。考虑到部分模型在OCR识别方面的限制，我们采用了OCR转写后输入答题的方式进行处理。

接下来，让我们通过几道典型题目，看看这些大模型的表现如何。

首先是选择题第一题，各家大模型均给出了正确答案，显示出它们在基础题目上的稳定表现。

选择题第五题是一道涉及函数的题目，所有大模型再次全部答对，进一步证明了它们在复杂题目上的解题能力。

然而，在选择题第八题中，豆包大模型和DeepSeek出现了错误，而其他模型均给出了正确答案。这道题目涉及对数函数，显示出部分模型在处理特定数学知识点时的局限性。

在解答题方面，我们以第16题为例，这是一道涉及数列和函数的题目。DeepSeek、通义千问、讯飞星火和豆包大模型均给出了正确的解题过程和答案，而文心X1和腾讯混元则出现了不同程度的错误。

最后，我们来看难度更高的第18题。讯飞星火、豆包大模型、DeepSeek、通义千问和GPT o3均获得了满分，而文心X1则因答案错误而失分。

经过综合评分，DeepSeek以143分的成绩位列榜首，讯飞星火以141分紧随其后，GPT o3以138分获得第三名。这次“考试”不仅展示了AI在数学领域的强大能力，也暴露了部分模型在实际应用中的短板。

DeepSeek作为最新版本的大模型，在思考推理和数学能力方面表现出色，但OCR识别效果不佳，且推理速度慢、资源消耗高。讯飞星火则凭借其较小的模型量级和高效的数学能力，在评测中取得了优异成绩，显示出其在教育领域的深厚积累。

豆包和通义千问等大模型也表现出色，与国际顶尖模型水平相当。这次“考试”不仅是对AI数学能力的一次检验，更是对未来AI在教育领域深度应用的一次探索。

举报 0收藏 0打赏 0评论 0

更多>同类资讯

苹果研究：AI大模型在高复杂度任务中推理能力遭质疑

06-08

AI助力，四小时邂逅六十余种“野朋友”，共筑生物多样性保护梦

多家生物多样性保护机构与腾讯联合，打磨出了“物种之眼”AI，以此为底层能力面向G/B端开放“野朋友生物多样性数据协作平台”，对野外红外相机、监测设备拍摄的图片进行批量处理，服务于种群调查、栖息地评估等科研和…

06-08

2025暑期档票房火爆开场，《碟中谍8》等大片引领观影热潮

06-08

2025高考遇AI：科技赋能教育，还是重塑人的价值？

06-08

徐京坤：挑战极限航海，以爱与信念铸就中国航海新篇章！

06-07

AI高考作文大比拼：谁是真才实学，谁在玩套路？

智东西第一时间对当前主流AI助手展开高考作文写作测试，涵盖字节跳动豆包、腾讯元宝、阿里云通义千问、阿里夸克、科大讯飞星火、昆仑万维天工、商汤商量、智谱清言、月之暗面Kimi、MiniMax海螺AI、Deep…

06-07

大模型高考作文比拼，腾讯垫底百度ChatGPT并列第一，幻觉问题成关键

值得注意的是，本次高考作文题目并没有以“人工智能”相关的考题，因此大模型之家随机抽选了北京卷的考题之一，对大模型的“写作能力”进行考察。作为一年一度的“整活”环节，大模型之家这次不仅用上了“判卷智能体”，…

06-07

面壁智能MiniCPM4：端侧模型极限提速，8B性能超12B竞品引关注

MiniCPM4-8B训练开销仅22%，加了长下文稀疏化版本，做到同等参数、性能更强，综合得分对标Qwen3-8B、超越Gemma3-12B，在下列同类端侧模型排行榜中分数排名第一。总体来看，MiniCP…

06-07

AI助力高考志愿填报，夸克百度讯飞谁更懂你的心？

06-07

数禾科技：自研反诈技术亮相网安博览会，守护用户数据安全获好评

06-07

苹果iPadOS 26大改版：新界面、手写笔升级，AI与应用全面进化！

06-07

喜临门荣获中国专利优秀奖，智能睡眠技术创新实力获国家级认可

06-07

小码王与黑龙江工程学院强强联手，打造信息学创新人才培育新高地

06-07

抖音重拳出击：高考季严查AI押题、虚假志愿规划等营销骗局

06-07

抖音高考护航：严查AI押题、作弊服务等违规行为

06-07

点击查看更多 +

全站最新

岚图FREE+预售在即：6款新配色亮相，中大型SUV科技感十足

2025款欧拉好猫GT官图亮相，细节微调，尾标换成“GWM”

岚图FREE+升级来袭！六色车身+鸿蒙投屏，中大型SUV新选择即将预售

岚图FREE+新配色亮相，中大型SUV定位，预售在即配置再升级！

欧拉好猫GT新款官图曝光，细节微调，“GWM”标识成新亮点

比亚迪详解“常压油箱”争议，反击“车圈恒大”不实言论

热门内容

荣耀“鲲鹏”照片事件真相大白，造谣者道歉遭刑拘
腾讯阿里AI to C战场“双吴”争霸，谁将问鼎AI搜索之巅？
英伟达全球总部或将落户中国台湾，黄仁勋下周宣布这一重大决定？
教育部新规：学生禁直接复制AI作业，强化独立思考与批判性思维
联发科天玑9400e发布：天玑9300+升级版，蓝牙升级至6.0
中国知网CNKI AI：重塑知识服务新生态，四大核心力引领未来
中国GPU市场竞争激烈，英伟达独占7成，华为昇腾紧追其后！
华为Mate 40系列（5G）已支持5G-A网络，性能再升级！
华为nova 14系列震撼登场！鸿蒙5直板机领衔，nova 14仅售2699元起
教育部新规：中小学分阶段用AI，严禁复制答案强化独立思考
华为nova14 Ultra震撼登场！鸿蒙5系统加持，售价4199元起
华为昇腾超节点技术突破：384卡高速互联，引领AI模型训练新纪元
DeepSeek新论文揭秘：梁文锋领衔探索AI训练推理成本效益之道
华为nova 15系列下半年将亮相，自研芯片加持产品力再升级？
荣耀400系列新品发布会：4K超清Live拼图，定格每个精彩瞬间？

本栏最新

苹果研究：AI大模型在高复杂度任务中推理能力遭质疑

AI助力，四小时邂逅六十余种“野朋友”，共筑生物多样性保护梦

2025暑期档票房火爆开场，《碟中谍8》等大片引领观影热潮

2025高考遇AI：科技赋能教育，还是重塑人的价值？

徐京坤：挑战极限航海，以爱与信念铸就中国航海新篇章！

AI高考作文大比拼：谁是真才实学，谁在玩套路？

本文链接：http://www.28at.com/showinfo-45-13557-0.htmlAI高考大考：DeepSeek、讯飞星火领跑，数学能力谁更强？

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇： 2025高考数学大考：AI谁最聪明？DeepSeek、讯飞星火突破140分大关！

下一篇：苹果研究：AI大模型在高复杂度任务中推理能力遭质疑

标签：

热门焦点

元宇宙的文旅赛道，还能如何发力？

来源：X增强现实苹果推出Vision Pro，为XR行业注入一剂强心针。而在苹果开发者大会上迪士尼CEO鲍勃·艾格在宣布迪士尼与苹果达成合作，其Disney+流媒体服务将于Vision Pro
数字虚拟人23年最新变化！

作者：小资来源：米塔之家自2021年元宇宙“爆炸”后，作为现实世界连接元宇宙的媒介之一，大批虚拟人跑步入场。到了2022年底，据天眼查数据显示，我国目前企业名称或经营范围
内容行业大变天，爆款全靠AI？

出品 | 微果酱（wjam123456）作者 | 陈出木题图 | 文心一格 AI的发展之快出乎所有人的预料，似乎一夜之间便呼啸而来。无论是资本的风向标，抑或是生活工作的辅助、流量口，还是茶余饭
中国虚拟数字人如何横向拓展市场需求，探索发展场景?

通过5G、AI等新技术更新换代，虚拟数字人为诸多下游行业带来新的发展机会。虚拟数字人技术以其简化性和精品性持续拓展泛娱乐、金融、教育、政务、医疗、零售等
米哈游推出元宇宙品牌；VR/AR老牌企业当红齐天完成B轮+融资

今日热点：苹果AR/VR头显的FaceTime或基于Memojis和SharePlay构建而成；VR/AR老牌企业当红齐天完成B轮+融资；米哈游推出元宇宙品牌HoYoverse；国产VR射击游戏《Contra
小众有趣NFT艺术作品欣赏（1）

随着NFT发展火热，越来越多领域与NFT融合，NFT艺术在加密领域中占据了很大一部分。NFT艺术与传统艺术有相似之处，也有完全不同的地方。NFT艺术与传统艺术一样，表现了
元宇宙需要的5个重要安全功能

元宇宙的可能用途使其成为一个令人难以置信的概念，但是，就像科技界的任何事物一样，需要做一些事情来控制其使用。元宇宙的安全功能需要仔细考虑和开发，以保护用户
初探元宇宙

2021年可以被称为“元宇宙”元年。继2021年3月沙盒游戏平台Roblox将“元宇宙”概念放入招股书中，被称为“元宇宙”第一股后，Facebook更名为Meta, 引发全球范围内
超级账本Julian Gordon：联盟链与公链的竞争不是非此即彼

在2021年《福布斯》区块链50强榜单中，29家企业使用Hyperledger超级账本技术，占比近60%。同年，研究机构Blockdata发布了的调查报告显示，访问Top100上市公司中，有 81

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

AI高考大考：DeepSeek、讯飞星火领跑，数学能力谁更强？

元宇宙的文旅赛道，还能如何发力？

数字虚拟人23年最新变化！

内容行业大变天，爆款全靠AI？

中国虚拟数字人如何横向拓展市场需求，探索发展场景?

米哈游推出元宇宙品牌；VR/AR老牌企业当红齐天完成B轮+融资

小众有趣NFT艺术作品欣赏（1）

元宇宙需要的5个重要安全功能

初探元宇宙

超级账本Julian Gordon：联盟链与公链的竞争不是非此即彼

最新推荐

超级碗的加密时刻：是主流信号还是“网络超级碗2.0”？

2022年元宇宙系列报告：UGC当道，XR带来新交互体验

音乐NFT平台里的下一匹黑马是谁？

过去女性在互联网领域是半边天，在Web3，将会是整片天！

NFT高玩必备：NFT分析工具大盘点

爆发在即的Layer2赛道百花齐放，谁将是领跑者？

猜你喜欢

热门推荐

相关资讯