当前位置：首页 > 科技 > 网络

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

来源：责编：时间：2024-10-13 14:11:51 244观看

导读快科技10月13日消息，近日，苹果公司的AI研究团队发表了一篇题为“Understanding the Limitations of Large Language Models in Mathematical Reasoning”的论文，揭示了大型语言模型（LLM）在数学推理方

快科技10月13日消息，近日，苹果公司的AI研究团队发表了一篇题为“Understanding the Limitations of Large Language Models in Mathematical Reasoning”的论文，揭示了大型语言模型（LLM）在数学推理方面的显著局限性。

尽管这些模型在生成人类水平的文本方面表现出色，但当处理简单的数学问题时，即使问题仅进行了微小的改动，如添加无关信息，模型的表现也会急剧下降。

在论文中，研究人员通过一个简单的数学问题证明了这一点。

他们提出了一个关于采摘猕猴桃的问题：奥利弗在周五挑选了 44 个猕猴桃，然后他在周六挑选 58 个猕猴桃，周日，他采摘的猕猴桃数量是周五的两倍。奥利弗有多少个猕猴桃？

此时，LLM能够正确地计算出答案。

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

但是，一旦问题中加入了无关的细节，如“其中5个奇异果比平均小”，模型便给出了错误的答案。

研究人员进一步对数百个类似的问题进行了修改，发现几乎所有问题的修改都导致了LLM回答成功率的大幅降低。

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

这一发现表明，LLM并未真正理解数学问题，而是更多地依赖于训练数据中的模式进行预测。

当需要进行真正的逻辑推理时，这些模型往往无法产生合理的结果，这一发现对人工智能的发展提供了重要的参考。

虽然LLM在许多领域表现优异，但其推理能力仍有待改进。

本文链接：http://www.28at.com/showinfo-17-119544-0.html苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：特斯拉新品空有其表：市场转而捧红Uber股价

下一篇： 90后程序员杀入A股四天亏32万！还想通过学习扭亏为盈

标签：

热门焦点

MIX Fold3包装盒泄露新机本月登场

小米的全新折叠屏旗舰MIX Fold3将于本月发布，近日该机的真机包装盒在网上泄露。从图上来看，新的MIX Fold3包装盒在外观设计方面延续了之前的方案，变化不大，这也是目前小米旗舰
SpringBoot中使用Cache提升接口性能详解

环境：springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架从 3.1 开始，对 Spring 应用程序提供了透明式添加缓存的支持。和事务支持一样，抽象缓存允许一致地使用各
Flowable工作流引擎的科普与实践

一.引言当我们在日常工作和业务中需要进行各种审批流程时，可能会面临一系列技术和业务上的挑战。手动处理这些审批流程可能会导致开发成本的增加以及业务复杂度的上升。在这
如何通过Python线程池实现异步编程？

线程池的概念和基本原理线程池是一种并发处理机制，它可以在程序启动时创建一组线程，并将它们置于等待任务的状态。当任务到达时，线程池中的某个线程会被唤醒并执行任务，执行完任
三万字盘点 Spring 九大核心基础功能

大家好，我是三友~~今天来跟大家聊一聊Spring的9大核心基础功能。话不多说，先上目录：图片友情提示，本文过长，建议收藏，嘿嘿嘿！一、资源管理资源管理是Spring的一个核心的基础功能，不
自动化在DevOps中的力量：简化软件开发和交付

自动化在DevOps中扮演着重要角色，它提升了DevOps的效能。通过自动化工具和方法，DevOps团队可以实现以下目标：消除手动和重复性任务。简化流程。在整个软件开发生命周期中实现更
一篇文章带你了解 CSS 属性选择器

属性选择器对带有指定属性的 HTML 元素设置样式。可以为拥有指定属性的 HTML 元素设置样式，而不仅限于 class 和 id 属性。一、了解属性选择器CSS属性选择器提供了一种简单而
共享单车的故事讲到哪了？

来源丨海克财经与共享充电宝相差不多，共享单车已很久没有被国内热点新闻关照到了。除了一再涨价和用户直呼用不起了。近日多家媒体再发报道称，成都、天津、郑州等地多个共享单
iQOO 11S屏幕细节公布：首发三星2K E6全感屏安卓最好的直屏手机

日前iQOO手机官方宣布，新一代电竞旗舰iQOO 11S将会在7月4日19:00正式与大家见面。随着发布时间的日益临近，官方关于该机的预热也更加密集，截至目前已

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

MIX Fold3包装盒泄露新机本月登场

SpringBoot中使用Cache提升接口性能详解

Flowable工作流引擎的科普与实践

如何通过Python线程池实现异步编程？

三万字盘点 Spring 九大核心基础功能

自动化在DevOps中的力量：简化软件开发和交付

一篇文章带你了解 CSS 属性选择器

共享单车的故事讲到哪了？

iQOO 11S屏幕细节公布：首发三星2K E6全感屏安卓最好的直屏手机

最新推荐

猜你喜欢

热门推荐

相关资讯