当前位置:首页 > 元宇宙 > AI

AI读不懂时钟,也算不出星期几?基础时间认知成挑战

来源: 责编: 时间:2025-05-18 16:00:30 126观看
导读近期,一项关于人工智能(AI)能力边界的研究引起了广泛关注。据LiveScience报道,尽管AI在编程、图像生成、文本创作乃至部分标准化测试中表现出色,但在执行日常生活中看似简单的“读时钟”和“算日子”等任务时,却频频失误。

近期,一项关于人工智能(AI)能力边界的研究引起了广泛关注。据LiveScience报道,尽管AI在编程、图像生成、文本创作乃至部分标准化测试中表现出色,但在执行日常生活中看似简单的“读时钟”和“算日子”等任务时,却频频失误。bz428资讯网——每日最新资讯28at.com

这项研究在2025年的“国际学习表征会议”(ICLR)上被详细介绍,相关论文已在arXiv平台上发布,尽管尚未完成同行评审。爱丁堡大学的研究员Rohit Saxena是论文的主要作者,他指出,人类对时间和日历概念的掌握几乎是本能的,而AI在这方面的欠缺应被视为一个需要重视的问题。bz428资讯网——每日最新资讯28at.com

为了验证这一点,研究团队设计了一系列专门测试时钟识别和日历计算的图像,并将它们输入到多个具备图文处理能力的大型语言模型中,包括meta的Llama 3.2-Vision、Anthropic的Claude-3.5 Sonnet、谷歌的Gemini 2.0和OpenAI的GPT-4。然而,测试结果显示,这些模型在判断时钟时间和推算日期星期上的准确率均未超过50%。bz428资讯网——每日最新资讯28at.com

Saxena进一步解释,AI在处理时钟问题时,不仅需要识别指针的位置,还要理解角度和分辨不同风格的表盘,如罗马数字或艺术化设计,这远比简单的物体识别复杂得多。而日历问题同样困扰着AI,特别是在处理如“每年第153天是星期几”这类问题时,错误率依然很高。bz428资讯网——每日最新资讯28at.com

研究数据显示,AI在读时钟上的正确率仅为38.7%,而在判断日历上的准确率更是低至26.3%。Saxena强调,AI的推理过程并不基于固定的算法规则,而是依赖于从训练数据中学习到的模式,这导致它们的推理过程缺乏一致性和准确性。bz428资讯网——每日最新资讯28at.com

研究还发现,当AI的训练样本中缺乏某些特定现象,如闰年或复杂的日历规则时,它们的表现会进一步下降。即使模型已经理解了“闰年”这一概念,它们也很难将这个知识正确地应用到具体的视觉判断中。bz428资讯网——每日最新资讯28at.com

针对这些问题,研究提出了两个改进方向:一是增加训练数据中的代表性示例,以确保AI能够接触到更多样化的情境;二是重新审视AI如何整合逻辑推理与空间感知能力,特别是在处理不常遇到的任务时。这些发现不仅揭示了AI的当前局限,也为未来的研究和开发提供了重要的指导。bz428资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
新疆夜空惊现神秘飞行物,目击者:与月争辉,瞬间加速消失
新疆夜空惊现神秘飞行物,目击者:与月争辉,瞬间加速消失
吉利私有化极氪背后的财务账本:年省百亿,剑指高质量发展
吉利私有化极氪背后的财务账本:年省百亿,剑指高质量发展
50岁大姐考驾照遇挫,教练态度恶劣还学时造假?驾校回应
50岁大姐考驾照遇挫,教练态度恶劣还学时造假?驾校回应
九号电动:700万台销量突破,一季度净利暴涨,智能两轮车新王者崛起?
九号电动:700万台销量突破,一季度净利暴涨,智能两轮车新王者崛起?
电车智驾普及快,为何高价油车却落后?
电车智驾普及快,为何高价油车却落后?
浪漫启航!自治区总工会助力单身职工寻觅北疆良缘
浪漫启航!自治区总工会助力单身职工寻觅北疆良缘
热门内容
  • 夸克AI新升级:深度搜索赋能,信息获取更高效智能
  • 英伟达全球总部或将落户中国台湾,黄仁勋下周宣布这一重大决定?
  • ChatGPT喊你名字了?用户反应不一,个性化尝试遭遇“恐怖谷”
  • 夸克AI新升级“深度搜索”,解锁高效获取信息新技能
  • 蚂蚁集团慷慨分红,单季净利达136亿,阿里持股33%共享成果
  • 教育部新规:学生禁直接复制AI作业,强化独立思考与批判性思维
  • 通义千问3重磅登场!全球顶尖开源模型,通义App与网页版等你来体验
  • 中国首部规范AI气象服务规章6月施行,气象领域将迎来新变革!
  • 小米5月下旬新品爆发:手机平板眼镜手表,你期待哪一款?
  • TIOBE 5月编程语言榜:Python强势领跑,占比创历史新高
  • 苹果新款Apple TV 4K即将发布,四大升级能否重塑智能客厅体验?
  • AI长片《海上女王郑一嫂》登陆新加坡院线,影视创作新时代来临?
  • 小米16曝光:或将新增多功能按键,轻薄机身年底亮相?
  • 教育部新规:中小学分阶段用AI,严禁复制答案强化独立思考
  • 360纳米AI新推MCP万能箱,打造个性化智能体提升效率
本栏最新
小米Civi 5 Pro:轻薄机身里的影像与性能王者?
小米Civi 5 Pro:轻薄机身里的影像与性能王者?
广东移动AI秘书上线:漏接电话不再怕,智能代答新体验!
广东移动AI秘书上线:漏接电话不再怕,智能代答新体验!
火石国际AIGC战略升级,携手兰大文学院开启校企合作新篇章
火石国际AIGC战略升级,携手兰大文学院开启校企合作新篇章
AI闺蜜医生:科学解答女性健康疑惑,守护全生命周期
AI闺蜜医生:科学解答女性健康疑惑,守护全生命周期
中国信息通信网络全球领先,5G应用广泛推动数字经济深度融合
中国信息通信网络全球领先,5G应用广泛推动数字经济深度融合
中国移动AI速记来袭,通话内容秒变文字记录,信息获取更便捷!
中国移动AI速记来袭,通话内容秒变文字记录,信息获取更便捷!

本文链接:http://www.28at.com/showinfo-45-12974-0.htmlAI读不懂时钟,也算不出星期几?基础时间认知成挑战

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 王树国:人文社科在新技术时代不可或缺,文科不会消亡

下一篇: 广州移动携手生态伙伴,共绘大湾区AI落地新蓝图

标签:
  • 热门焦点
  • 这一超级富豪“逆袭”,身价大增4330亿

    来源:侃见财经互联网的突围没有“终点”。在快节奏的商业环境下,不断的试错成了互联网企业的标配,一年一个风口,一个风口造就一个热点,但是回头来看,最终受益的还是身处
  • “任何国产元宇宙都是假元宇宙”

    上个月,华语乐坛的优质偶像之一,DOTA2资深玩家林俊杰,在国外元宇宙产品分布式大陆(Decentraland)上买了三块虚拟地产,花了12.3万美元(也就是人民币接近80万)。截至目
  • 企业热、用户冷,元宇宙第一站将是“营销场”?

    如果说2021年底什么最火热,那元宇宙当之无愧。“万物皆可元宇宙”似乎成为新的流行语,在广告中也常常听到“社交元宇宙”“购物元宇宙”等等。就在近日,有消息传
  • 韩国主权基金增加对硅谷初创公司投资 押注元宇宙和人工智能

    韩国投资公司(KIC)CEO Seoungho Jin预计,该公司在旧金山的办事处今年将扩招人手,探索在硅谷投资科技、健康和绿色项目。规模高达2000亿美元的韩国主权财富基金—
  • 避坑指南:远离具有这些特性的NFT

    关于NFT,在我们的文章中一直以来都是常驻嘉宾,不止因为NFT背后隐藏的潜力,更因为在这个NFT世界里冥冥之中仿佛有一双幕后的手,OpenSea、库里、ERC115、视觉中国、
  • “啫喱”超越微信登顶:首款“元宇宙社交App”会昙花一现吗?

    作者| 赤木瓶子如何终结“昙花一现”的命运,是潮流社交产品的长期命题,如今,在元宇宙浪潮的洗礼下,这一命题正在迎来新的可能性。近段时间,一款名为“啫喱”的社交A
  • 比特币的价格越高,使用价值越大

    隔夜比特币还是在精准地横盘在42k上方。空头昨日试图发起一波小的攻势,但是晚上就被多头掰了回来。以太坊的链上gas price降到了60 gwei以下,彰显着市场活跃度的
  • 这场虚拟发布会,当面“造假”!

    英伟达去年4月份那场发布会,你曾看出什么不对劲的地方吗?你品,你细品——在计算机图形学顶会SIGGRAPH 2021上,英伟达通过一部纪录片自曝:那场发布会内藏玄机~你看到
  • 全球十大元宇宙概念游戏

    A股市场中,不少游戏公司早早搭上了元宇宙概念。举例,中青宝宣称将发布一款元宇宙概念的模拟经营类游戏,尽管游戏尚在研发中,这一消息已经让中青宝的股价在51个交易

最新推荐

猜你喜欢

热门推荐

相关资讯

Top