当前位置:首页 > 元宇宙 > AI

AI读不懂时钟,也算不出星期几?基础时间认知成挑战

来源: 责编: 时间:2025-05-18 16:00:30 177观看
导读近期,一项关于人工智能(AI)能力边界的研究引起了广泛关注。据LiveScience报道,尽管AI在编程、图像生成、文本创作乃至部分标准化测试中表现出色,但在执行日常生活中看似简单的“读时钟”和“算日子”等任务时,却频频失误。

近期,一项关于人工智能(AI)能力边界的研究引起了广泛关注。据LiveScience报道,尽管AI在编程、图像生成、文本创作乃至部分标准化测试中表现出色,但在执行日常生活中看似简单的“读时钟”和“算日子”等任务时,却频频失误。BNp28资讯网——每日最新资讯28at.com

这项研究在2025年的“国际学习表征会议”(ICLR)上被详细介绍,相关论文已在arXiv平台上发布,尽管尚未完成同行评审。爱丁堡大学的研究员Rohit Saxena是论文的主要作者,他指出,人类对时间和日历概念的掌握几乎是本能的,而AI在这方面的欠缺应被视为一个需要重视的问题。BNp28资讯网——每日最新资讯28at.com

为了验证这一点,研究团队设计了一系列专门测试时钟识别和日历计算的图像,并将它们输入到多个具备图文处理能力的大型语言模型中,包括meta的Llama 3.2-Vision、Anthropic的Claude-3.5 Sonnet、谷歌的Gemini 2.0和OpenAI的GPT-4。然而,测试结果显示,这些模型在判断时钟时间和推算日期星期上的准确率均未超过50%。BNp28资讯网——每日最新资讯28at.com

Saxena进一步解释,AI在处理时钟问题时,不仅需要识别指针的位置,还要理解角度和分辨不同风格的表盘,如罗马数字或艺术化设计,这远比简单的物体识别复杂得多。而日历问题同样困扰着AI,特别是在处理如“每年第153天是星期几”这类问题时,错误率依然很高。BNp28资讯网——每日最新资讯28at.com

研究数据显示,AI在读时钟上的正确率仅为38.7%,而在判断日历上的准确率更是低至26.3%。Saxena强调,AI的推理过程并不基于固定的算法规则,而是依赖于从训练数据中学习到的模式,这导致它们的推理过程缺乏一致性和准确性。BNp28资讯网——每日最新资讯28at.com

研究还发现,当AI的训练样本中缺乏某些特定现象,如闰年或复杂的日历规则时,它们的表现会进一步下降。即使模型已经理解了“闰年”这一概念,它们也很难将这个知识正确地应用到具体的视觉判断中。BNp28资讯网——每日最新资讯28at.com

针对这些问题,研究提出了两个改进方向:一是增加训练数据中的代表性示例,以确保AI能够接触到更多样化的情境;二是重新审视AI如何整合逻辑推理与空间感知能力,特别是在处理不常遇到的任务时。这些发现不仅揭示了AI的当前局限,也为未来的研究和开发提供了重要的指导。BNp28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
新疆夜空惊现神秘飞行物,目击者:与月争辉,瞬间加速消失
新疆夜空惊现神秘飞行物,目击者:与月争辉,瞬间加速消失
吉利私有化极氪背后的财务账本:年省百亿,剑指高质量发展
吉利私有化极氪背后的财务账本:年省百亿,剑指高质量发展
50岁大姐考驾照遇挫,教练态度恶劣还学时造假?驾校回应
50岁大姐考驾照遇挫,教练态度恶劣还学时造假?驾校回应
九号电动:700万台销量突破,一季度净利暴涨,智能两轮车新王者崛起?
九号电动:700万台销量突破,一季度净利暴涨,智能两轮车新王者崛起?
电车智驾普及快,为何高价油车却落后?
电车智驾普及快,为何高价油车却落后?
浪漫启航!自治区总工会助力单身职工寻觅北疆良缘
浪漫启航!自治区总工会助力单身职工寻觅北疆良缘
热门内容
  • 夸克AI新升级:深度搜索赋能,信息获取更高效智能
  • 英伟达全球总部或将落户中国台湾,黄仁勋下周宣布这一重大决定?
  • ChatGPT喊你名字了?用户反应不一,个性化尝试遭遇“恐怖谷”
  • 夸克AI新升级“深度搜索”,解锁高效获取信息新技能
  • 蚂蚁集团慷慨分红,单季净利达136亿,阿里持股33%共享成果
  • 教育部新规:学生禁直接复制AI作业,强化独立思考与批判性思维
  • 通义千问3重磅登场!全球顶尖开源模型,通义App与网页版等你来体验
  • 中国首部规范AI气象服务规章6月施行,气象领域将迎来新变革!
  • 小米5月下旬新品爆发:手机平板眼镜手表,你期待哪一款?
  • TIOBE 5月编程语言榜:Python强势领跑,占比创历史新高
  • 苹果新款Apple TV 4K即将发布,四大升级能否重塑智能客厅体验?
  • AI长片《海上女王郑一嫂》登陆新加坡院线,影视创作新时代来临?
  • 小米16曝光:或将新增多功能按键,轻薄机身年底亮相?
  • 教育部新规:中小学分阶段用AI,严禁复制答案强化独立思考
  • 360纳米AI新推MCP万能箱,打造个性化智能体提升效率
本栏最新
小米Civi 5 Pro:轻薄机身里的影像与性能王者?
小米Civi 5 Pro:轻薄机身里的影像与性能王者?
广东移动AI秘书上线:漏接电话不再怕,智能代答新体验!
广东移动AI秘书上线:漏接电话不再怕,智能代答新体验!
火石国际AIGC战略升级,携手兰大文学院开启校企合作新篇章
火石国际AIGC战略升级,携手兰大文学院开启校企合作新篇章
AI闺蜜医生:科学解答女性健康疑惑,守护全生命周期
AI闺蜜医生:科学解答女性健康疑惑,守护全生命周期
中国信息通信网络全球领先,5G应用广泛推动数字经济深度融合
中国信息通信网络全球领先,5G应用广泛推动数字经济深度融合
中国移动AI速记来袭,通话内容秒变文字记录,信息获取更便捷!
中国移动AI速记来袭,通话内容秒变文字记录,信息获取更便捷!

本文链接:http://www.28at.com/showinfo-45-12974-0.htmlAI读不懂时钟,也算不出星期几?基础时间认知成挑战

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 王树国:人文社科在新技术时代不可或缺,文科不会消亡

下一篇: 广州移动携手生态伙伴,共绘大湾区AI落地新蓝图

标签:
  • 热门焦点
  • AIGC产品测评TOP25丨谁能抢到下个十年的“船票”?

    Tech星球(微信ID:tech618) 文 | 何煦阳策划 | 杨晓鹤封面来源 | 图虫创意 2016年,李彦宏站在百度联盟峰会的讲台上,向所有人宣布:互联网的下一幕是人工智能。同年,Google 旗下 Dee
  • 从科幻走进现实,元宇宙概念逐渐清晰

    2021年,元宇宙概念如同一颗炸弹投进互联网行业,掀起了一场数字海啸,众多企业纷纷入局,在此新领域展开新探索。那么,加速狂奔的元宇宙究竟是什么?概念翻红,元宇宙走进资本圈2021年3
  • “虚拟人”角斗场,基于“硬实力”下的人性平衡法则?

    在打工人“反内卷”的当下,一众虚拟人却“内卷”了起来。从北京春晚虚拟人苏小妹与刘宇演绎歌舞《星河入梦》,央美毕业的虚拟人夏语冰登上央视节目《对话》,湖南
  • 元宇宙“概念股”集体崩塌,背后究竟发生了什么?

    近期,Roblox和Meta公布了第四季度的财务报告,在财报发布一日后,股价大跌。作为市值一度超过1万亿美元的世界第六大公司Meta,股价大跌4%,市值降至5650亿美元,甚至跌出
  • NFT也有黄牛?这家公司专门对付外挂作弊机器人

    澳大利亚前总理马尔科姆·特恩布尔 (Malcolm Turnbull) 是支持萨姆·Crowther (Sam Crowther) 的人之一,Sam是一名出生于纽卡斯尔的黑客,他的职业生涯始于为国防
  • 元宇宙画廊体验报告:有点头疼。

    2 月 10 日,Hrishi Rajasekar 在旧金山铸币厂的沉浸式 NFT 展览 Verse 观看增强现实艺术品。“我们现在在虚拟世界中吗?时间好像变长了” 我问身后排队的人。我
  • 以太坊面临来自Fantom的巨大挑战

    众所周知,区块链和加密货币项目经常因其对环境的影响而受到批评。但是有一个非营利性的加密货币和区块链项目说它比其他的更环保。今天老雅痞就给大家聊一聊加
  • 花旗集团前高管加入Provenance区块链,担任CEO

    No.1 花旗集团前高管加入Provenance区块链,担任CEO3月1日消息,Provenance区块链基金会已任命花旗集团前高管摩根·麦肯尼(Morgan McKenney)为新任首席执行官。麦肯
  • Staking 收益翻倍?

    以太坊质押可能很快就会有两倍的利润。Coinbase 估计,在 1 月份以太坊网络合并后,持有 ETH 的回报将翻倍。增长预期假设来自加密货币交易所 Coinbase 的估计是准

最新推荐

猜你喜欢

热门推荐

相关资讯

Top