当前位置:首页 > 科技  > 网络

苹果炮轰AI推理模型:全是假思考!所谓思考只是一种假象

来源: 责编: 时间:2025-06-09 09:37:10 94观看
导读 快科技6月8日消息,苹果近日发表了一篇研究论文,称推理模型全都没真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。有人总结到:苹果刚刚当了一回

快科技6月8日消息,苹果近日发表了一篇研究论文,称推理模型全都没真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。gEi28资讯网——每日最新资讯28at.com

苹果炮轰AI推理模型:全是假思考!所谓思考只是一种假象gEi28资讯网——每日最新资讯28at.com

有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。gEi28资讯网——每日最新资讯28at.com

苹果团队认为,现有评估主要集中在既定的数学和编码基准上,看模型终答案是否正确,但可能存在模型训练时见过类似题目。gEi28资讯网——每日最新资讯28at.com

并且,这些评估大都缺乏对“思考过程质量”的分析,比如中间步骤是否逻辑一致、是否绕弯路等。gEi28资讯网——每日最新资讯28at.com

为了更客观测试推理模型的推理能力,他们设计了4类谜题环境:汉诺塔、跳棋交换、过河问题、积木世界,并且这4类谜题的难度可以精确控制.gEi28资讯网——每日最新资讯28at.com

随着问题变难,推理模型初始会延长思考,但随后思考深度反而下降,尽管仍有充足token预算,它们却在需要深入思考时选择了放弃!gEi28资讯网——每日最新资讯28at.com

并且,当问题复杂度继续增加并超过某个临界点时,无论是推理模型还是标准模型都会经历完全的性能崩溃,准确率直线下降至零。gEi28资讯网——每日最新资讯28at.com

对此,有网友讽刺到:“苹果拥有多的资金,2年了也没有拿出像样的成果,现在自己落后了,却来否定别人的成果。”gEi28资讯网——每日最新资讯28at.com

据悉,Apple Intelligence在2024年WWDC正式亮相,在这一年里,苹果宣传中的许多功能都经历延期、不够完善甚至被下架。gEi28资讯网——每日最新资讯28at.com

不过也有人指出,这篇论文没有看上去那么消极,而是呼吁设立更好的推理机制和评估办法。gEi28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-17-157770-0.html苹果炮轰AI推理模型:全是假思考!所谓思考只是一种假象

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 每人奖励3000元!京东外卖表彰三名助考骑手

下一篇: “韦神”的牙齿问题其实很多人都有:从牙齿出血到掉光仅有三步

标签:
  • 热门焦点
  • 俄罗斯:将审查iPhone等外国公司设备 保数据安全

    iPhone和特斯拉都属于在各自领域领头羊的品牌,推出的产品也也都是数一数二的,但对于一些国家而言,它们的产品可靠性和安全性还是在限制范围内。近日,俄罗斯联邦通信、信息技术
  • 不容错过的MSBuild技巧,必备用法详解和实践指南

    一、MSBuild简介MSBuild是一种基于XML的构建引擎,用于在.NET Framework和.NET Core应用程序中自动化构建过程。它是Visual Studio的构建引擎,可在命令行或其他构建工具中使用
  • 让我们一起聊聊文件的操作

    文件【1】文件是什么?文件是保存数据的地方,是数据源的一种,比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据,它既可以保
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 零售大模型“干中学”,攀爬数字化珠峰

    文/侯煜编辑/cc来源/华尔街科技眼对于绝大多数登山爱好者而言,攀爬珠穆朗玛峰可谓终极目标。攀登珠峰的商业路线有两条,一是尼泊尔境内的南坡路线,一是中国境内的北坡路线。相
  • 最“俊美”淘宝卖家,靠直播和短视频圈粉,上架秒光,年销3000万

    来源 | 电商在线文|易琬玉编辑|斯问受访店铺:Ringdoll戒之人形图源:微博@御座的黄山、“Ringdoll戒之人形”淘宝店铺有关外貌的评价,黄山已经听累了。生于1985年的他,哪
  • 自律,给不了Keep自由!

    来源 | 互联网品牌官作者 | 李大为编排 | 又耳 审核 | 谷晓辉自律能不能给用户自由暂时不好说,但大概率不能给Keep自由。近日,全球最大的在线健身平台Keep正式登陆港交所,努力
  • 大厂卷向扁平化

    来源:新熵作者丨南枝 编辑丨月见大厂职级不香了。俗话说,兵无常势,水无常形,互联网企业调整职级体系并不稀奇。7月13日,淘宝天猫集团启动了近年来最大的人力制度改革,目前已形成一
  • 外交部:美方应停止在网络安全问题上不负责任地指责他国

      中国外交部今天(16日)举行例行记者会。会上,有记者问,美国情报官员称,他们正在阻拦来自中国以及其他国家的黑客获取相关科研成果。 中方对此有何评论?对此
Top