当前位置:首页 > 元宇宙 > AI

GPT-5“变笨”实锤:退休教授出了道井字棋送分题,结果它真送了

来源: 责编: 时间:2025-09-04 13:30:34 95观看
导读 退休经济学教授用一个简单问题干懵 GPT-5,其拉胯表现与奥尔特曼口中“博士级 AI”的宣传大相径庭。问题很简单,关于咱小时候都玩过的“井”字棋游戏。教授告诉 GPT-5:“游戏开始前,把棋盘向右旋转 90 度一次”。

退休经济学教授用一个简单问题干懵 GPT-5,其拉胯表现与奥尔特曼口中“博士级 AI”的宣传大相径庭。9Ix28资讯网——每日最新资讯28at.com

问题很简单,关于咱小时候都玩过的“井”字棋游戏。9Ix28资讯网——每日最新资讯28at.com

教授告诉 GPT-5:“游戏开始前,把棋盘向右旋转 90 度一次”。显然,按常识来看,这么做根本不会让游戏本身有任何变化。9Ix28资讯网——每日最新资讯28at.com

9Ix28资讯网——每日最新资讯28at.com

然而,GPT-5 侃侃而谈:9Ix28资讯网——每日最新资讯28at.com

玩家们早已习惯了“直立”的井字棋棋盘,旋转可能会微妙地改变他们识别威胁与机会的方式。从数学角度看,将棋盘旋转 90 度并不会改变可能获胜的组合,就结果而言,它仍然是同一个游戏。但从心理层面来说,玩家的感受可能会有所不同。9Ix28资讯网——每日最新资讯28at.com

后续 GPT-5 还接连出了不少离谱操作,直接让教授无了个大语。9Ix28资讯网——每日最新资讯28at.com

教授也直言,现在的 GPT-5 和刚发布时完全不是一个感觉,这种风格转变,大概率是因为 OpenAI 的策略调整:特意让这款新模型往 GPT-4o 的方向靠,变得“更亲切、更友好”。9Ix28资讯网——每日最新资讯28at.com

在最近的一次采访中,奥特曼承认确实对 GPT-5 进行了调整,称 GPT-5 最初的发布工作存在处理不当之处(让 GPT-4o 等一众模型直接退役),于是乎,OpenAI 悄然为 GPT-5 推送了一项语气更新,使其风格“亲切了许多”。9Ix28资讯网——每日最新资讯28at.com

By the way,奥特曼已经开炒 GPT-6 了,表示“GPT-6 的到来速度,会比 GPT-4 到 GPT-5 的间隔更快”。9Ix28资讯网——每日最新资讯28at.com

另外,有人还曝出 OpenAI 正在测试 ChatGPT 的“Thinking effort”新功能。9Ix28资讯网——每日最新资讯28at.com

GPT-5 回答漏洞百出

这位教授名叫 Gary Smith,是波莫纳学院的一名经济学教授,近期刚刚退休。9Ix28资讯网——每日最新资讯28at.com

当他向 GPT-5 提出“井字棋棋盘旋转 90 度”的问题时,模型的回答已经漏洞百出。而后续,GPT-5 还抛出了与民间博弈论相悖的观点。9Ix28资讯网——每日最新资讯28at.com

按照民间博弈论的常识,井字棋先落子在角落,获胜概率会更高。9Ix28资讯网——每日最新资讯28at.com

GPT-5 却笃定称“选择正中央的格子仍是最强的开局走法”,还继续解释:“当棋盘方向改变时,玩家可能会错误评估落子在边缘与角落的优劣”,这番话毫无逻辑可言。9Ix28资讯网——每日最新资讯28at.com

9Ix28资讯网——每日最新资讯28at.com

之后,教授顺着这个话题追问:“旋转棋盘是否会让人类更难玩好这个游戏?”9Ix28资讯网——每日最新资讯28at.com

也正是从这个问题开始,GPT-5 彻底陷入了语无伦次的状态。它先是说道:9Ix28资讯网——每日最新资讯28at.com

从纯粹的策略角度来看,旋转棋盘不会改变任何事情。每一条获胜线(横排、竖列、对角线)都只是映射到了另一条获胜线。因此,如果你是人工智能或一位能完美走棋的人类,旋转井字棋与标准井字棋完全相同。9Ix28资讯网——每日最新资讯28at.com

这段话虽然表述啰嗦,但内容本身是对的。可没等教授理清思路,GPT-5 话锋一转“但对于人类而言,情况就不同了”……9Ix28资讯网——每日最新资讯28at.com

接下来,GPT-5 继续“热心”输出,却让教授越看越不对劲 —— 不仅回复又长又刻意讨好,风格反倒更像 GPT-4o,关键是其中夹杂着不少一眼就能看穿的错误,与 OpenAI 近期宣传的“和拥有博士级智力的得力朋友聊天”的体验,简直是天差地别。9Ix28资讯网——每日最新资讯28at.com

随后,GPT-5 又一次主动请缨,说要“绘制带有位置标记的旋转井字棋棋盘…… 这样你就能看到每种旋转如何影响玩家对棋盘的识别”。9Ix28资讯网——每日最新资讯28at.com

最后结果是,这些图不仅完全混乱,还到处是拼写错误,出现了好几块毫无意义的空白棋盘。9Ix28资讯网——每日最新资讯28at.com

9Ix28资讯网——每日最新资讯28at.com

Two More Things

有网友最近发现,OpenAI 正在为 ChatGPT 开发一项名为“Thinking effort”的新功能,用户可自主选择 ChatGPT 的思考强度。9Ix28资讯网——每日最新资讯28at.com

目前该功能已在测试中,现阶段共设有四个强度等级:light,内部属性值为 5;standard,对应数值为 18;extended,对应数值 48;最高级 max 则达到 200。9Ix28资讯网——每日最新资讯28at.com

这些数值代表模型的内部“运算资源”配额。配额越高,意味着模型会执行更多运算步骤,通常能给出更深入的答案,但响应速度也会相应变慢。9Ix28资讯网——每日最新资讯28at.com

其中,max 等级设有使用权限限制,仅订阅价格为 200 美元的高级套餐 Pro 用户可使用。9Ix28资讯网——每日最新资讯28at.com

9Ix28资讯网——每日最新资讯28at.com

另外,奥尔特曼最近在接受 CNBC 采访时开始炒 GPT-6 了,指出 GPT-6 不仅能响应用户需求,还能主动适配用户,允许用户创建符合个人偏好的聊天机器人。9Ix28资讯网——每日最新资讯28at.com

他认为,记忆功能是让 ChatGPT 实现真正个性化的关键,并表示 OpenAI 正与心理学家密切合作以优化产品,团队会追踪用户在使用过程中的感受,并长期监测用户的使用体验变化。9Ix28资讯网——每日最新资讯28at.com

值得一提的是,奥尔特曼表示增强版记忆功能是今年 ChatGPT 推出的他最喜欢的功能,但存在隐私隐患,尤其是临时记忆数据目前尚未加密。9Ix28资讯网——每日最新资讯28at.com

对于应对方案,奥尔特曼只是模糊地说,加密功能“很可能”会在未来添加,但目前暂无具体时间规划。9Ix28资讯网——每日最新资讯28at.com

谈及未来方向,奥尔特曼提到自己比较关注脑机接口领域,同时对能源、新型硬件载体、机器人技术以及更高效的数据中心建设方式感兴趣。9Ix28资讯网——每日最新资讯28at.com

他还提到 ChatGPT 的发展存在局限性:9Ix28资讯网——每日最新资讯28at.com

这些模型在聊天交互这一应用场景上已经触及天花板,它们的表现不会再大幅提升了…… 甚至有可能会变差。9Ix28资讯网——每日最新资讯28at.com

参考链接:9Ix28资讯网——每日最新资讯28at.com

[1]https://futurism.com/gpt-5-simple-question-confusion9Ix28资讯网——每日最新资讯28at.com

[2]https://www.cnbc.com/2025/08/19/sam-altman-on-gpt-6-people-want-memory.html9Ix28资讯网——每日最新资讯28at.com

[3]https://www.bleepingcomputer.com/news/artificial-intelligence/openai-is-testing-thinking-effort-for-chatgpt/9Ix28资讯网——每日最新资讯28at.com

本文来自微信公众号:量子位(ID:QbitAI),作者:西风9Ix28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-27256-0.htmlGPT-5“变笨”实锤:退休教授出了道井字棋送分题,结果它真送了

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 快手:已上线 AI 内容标识,疑似 AI 内容也会提示

下一篇: 优必选人形机器人Walker S2再创佳绩,2.5亿大单引领全球订单新高度

标签:
  • 热门焦点
  • 在元宇宙卖酸奶,这波联动燃爆了!

    来源:品牌头版 或许,每个人心中都住着一个小馋孩。可能是童年时百吃不厌,觉得新奇又有趣的跳跳糖;可能是味道香甜,咬下一口嘎嘣脆的扁桃仁;还有可能,是某种不知为什么,就是很爱吃的
  • 10亿基金,李彦宏呼唤下一个AI独角兽

    ©️深响原创 · 作者|何文 AI太热了。 在海外,OpenAI估值已超270亿美元、英伟达市值破万亿、微软把GPT整合进了全线产品。在国内,百度、阿里、华为、商汤等大公司,以及
  • VR/AR迷失元宇宙“硝烟”

    不温不火的VR/AR可穿戴设备因元宇宙崛起火了一阵,又随着元宇宙回归平静。1月份,微软在 Surface 设备、HoloLens 混合现实硬件和 Xbox 等部门裁员,其中负责混合现实硬件(MR)的Holo
  • 字节、腾讯、网易鏖战元宇宙背后,大厂究竟在争夺什么?

    正当互联网商业踌躇不前,互联网大厂为了在存量中的增长挤破头皮之时,元宇宙的概念被资本点燃。先是Facebook更名Meta正式进军元宇宙,然后字节跳动收购了一家VR硬
  • 江西将探索成立元宇宙联盟,韩国将加强对NFT和元宇宙的监管

    《元宇宙新鲜事》有:江西将探索成立元宇宙联盟,支持南昌规划建设元宇宙试验区;韩国金融监督局将加强对NFT和元宇宙的监管;任天堂社长表示暂时不打算加入元宇宙。【
  • 银保监会:打击以“元宇宙”为名义的违法行为

    今日,银保监会发布《关于防范以“元宇宙”名义进行非法集资的风险提示》,全文如下:近期,一些不法分子蹭热点,以“元宇宙投资项目”“元宇宙链游”等名目吸收资金,涉
  • NFT盗窃案:为什么NFT市场被盗窃和黑客所困扰?

    Block-806NFT的增长值得关注。许多人愿意为数字艺术支付数百万美元,世界正在走向数字化。报告显示,NFT市场和NFT收藏从2020年的1.06亿美元增加到了2021年的442亿
  • NFT 技术将传世之作带入博物馆

    意大利四大博物馆已与一个项目合作,该项目将展示和销售达芬奇、卡拉瓦乔、拉斐尔和莫迪利亚尼等人的杰作的 NFT复制品。该计划采用了 科技公司Cincello的国际专
  • 元宇宙专题二:GameFi 深度解析,元宇宙内容雏形显现

    GameFi=Game(游戏)+DEFI(去中心化金融),核心特点为“Play to Earn”。通过技术与去中心化价值观赋能,GameFi 游戏资产化身为NFT 和代币上链,具备了可验证性和流通性;开
Top