当前位置:首页 > 科技  > 手机

AI推理能力被苹果研究员质疑,简单数学题稍作改动就出错

来源: 责编: 时间:2024-10-12 10:07:31 142观看
导读 10月12日消息,苹果研究员发布了一篇论文,名为《理解大型语言模型中数学推理的局限性》。该论文提到,LLM在解答数学问题时容易受到干扰,一道简单的数学题只要稍加改动,比如添加无关紧要的信息,LLM就会推理错误。论文中列举

10月12日消息,苹果研究员发布了一篇论文,名为《理解大型语言模型中数学推理的局限性》。该论文提到,LLM在解答数学问题时容易受到干扰,一道简单的数学题只要稍加改动,比如添加无关紧要的信息,LLM就会推理错误。IiV28资讯网——每日最新资讯28at.com

论文中列举出了几个案例,比如“奥利弗星期五摘了44个奇异果,星期六摘了58个,星期日摘得数量是星期五的两倍,那么奥利弗一共摘了多少个奇异果?”,面对这样简单的数学题,LLM能够计算出准确答案。如果在原题上加一个无关紧要的信息,比如“星期日,他摘得奇异果数量是星期五的两倍,其中5个比平均小”,这时,LLM却给出了错误的答案(88-5=83,正确答案应该是44×2=88)。IiV28资讯网——每日最新资讯28at.com

值得一提的是,苹果研究人员经过修改数百个问题,几乎所有问题都会影响LLM给出正确的回答。苹果研究人员认为,LLM并不是真正理解数学问题,而是根据训练数据中的模式进行预测。IiV28资讯网——每日最新资讯28at.com

IiV28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-118450-0.htmlAI推理能力被苹果研究员质疑,简单数学题稍作改动就出错

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 直屏党的梦想旗舰!iQOO 13登上2K直屏顶峰

下一篇: 2K国屏之光!一加13看点汇总:屏幕再次脱胎换骨

标签:
  • 热门焦点
  • 6月安卓手机好评榜:魅族20 Pro蝉联冠军

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年6月1日至6月30日,仅限国内市场。第一名:魅族20 Pro好评率:95%5月份的时候魅族20 Pro就是
  • 0糖0卡0脂 旭日森林仙草乌龙茶优惠:15瓶到手29元

    旭日森林无糖仙草乌龙茶510ml*15瓶平时要卖为79.9元,今日下单领取50元优惠券,到手价为29.9元。产品规格:0糖0卡0脂,添加草本仙草汁,清凉爽口,富含茶多酚,保留
  • 分享六款相见恨晚的PPT模版网站, 祝你做出精美的PPT!

    1、OfficePLUSOfficePLUS网站旨在为全球Office用户提供丰富的高品质原创PPT模板、实用文档、数据图表及个性化定制服务。优点:OfficePLUS是微软官方网站,囊括PPT模板、Word模
  • 多线程开发带来的问题与解决方法

    使用多线程主要会带来以下几个问题:(一)线程安全问题  线程安全问题指的是在某一线程从开始访问到结束访问某一数据期间,该数据被其他的线程所修改,那么对于当前线程而言,该线程
  • Temu起诉SHEIN,跨境电商战事升级

    来源 | 伯虎财经(bohuFN)作者 | 陈平安日前据外媒报道,拼多多旗下跨境电商平台Temu正对竞争对手SHEIN提起新诉讼,诉状称Shein“利用市场支配力量强迫服装厂商与之签订独家
  • “又被陈思诚骗了”

    作者|张思齐 出品|众面(ID:ZhongMian_ZM)如今的国产悬疑电影,成了陈思诚的天下。最近大爆电影《消失的她》票房突破30亿断层夺魁暑期档,陈思诚再度风头无两。你可以说陈思诚的
  • 花7万退货退款无门:谁在纵容淘宝珠宝商家造假?

    来源:极点商业作者:杨铭在淘宝购买珠宝玉石后,因为保证金不够赔付,店铺关闭,退货退款难、维权无门的比比皆是。“提供相关产品鉴定证书,支持全国复检,可以30天无理由退换货。&
  • 华为Mate 60保护壳曝光:硕大后置相机模组 凸起程度有惊喜

    这段时间以来,关于华为新旗舰的爆料日渐密集。据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将
  • AMD的AI芯片转单给三星可能性不大 与台积电已合作至2nm制程

    据 DIGITIMES 消息,英伟达 AI GPU 出货逐季飙升,接下来 AMD MI 300 系列将在第 4 季底量产。而半导体业内人士表示,近日传出 AMD 的 AI 芯片将转单给
Top