当前位置:首页 > 元宇宙 > AI

AI读不懂时钟,也算不出星期几?基础时间认知成挑战

来源: 责编: 时间:2025-05-18 16:00:30 144观看
导读近期,一项关于人工智能(AI)能力边界的研究引起了广泛关注。据LiveScience报道,尽管AI在编程、图像生成、文本创作乃至部分标准化测试中表现出色,但在执行日常生活中看似简单的“读时钟”和“算日子”等任务时,却频频失误。

近期,一项关于人工智能(AI)能力边界的研究引起了广泛关注。据LiveScience报道,尽管AI在编程、图像生成、文本创作乃至部分标准化测试中表现出色,但在执行日常生活中看似简单的“读时钟”和“算日子”等任务时,却频频失误。YAd28资讯网——每日最新资讯28at.com

这项研究在2025年的“国际学习表征会议”(ICLR)上被详细介绍,相关论文已在arXiv平台上发布,尽管尚未完成同行评审。爱丁堡大学的研究员Rohit Saxena是论文的主要作者,他指出,人类对时间和日历概念的掌握几乎是本能的,而AI在这方面的欠缺应被视为一个需要重视的问题。YAd28资讯网——每日最新资讯28at.com

为了验证这一点,研究团队设计了一系列专门测试时钟识别和日历计算的图像,并将它们输入到多个具备图文处理能力的大型语言模型中,包括meta的Llama 3.2-Vision、Anthropic的Claude-3.5 Sonnet、谷歌的Gemini 2.0和OpenAI的GPT-4。然而,测试结果显示,这些模型在判断时钟时间和推算日期星期上的准确率均未超过50%。YAd28资讯网——每日最新资讯28at.com

Saxena进一步解释,AI在处理时钟问题时,不仅需要识别指针的位置,还要理解角度和分辨不同风格的表盘,如罗马数字或艺术化设计,这远比简单的物体识别复杂得多。而日历问题同样困扰着AI,特别是在处理如“每年第153天是星期几”这类问题时,错误率依然很高。YAd28资讯网——每日最新资讯28at.com

研究数据显示,AI在读时钟上的正确率仅为38.7%,而在判断日历上的准确率更是低至26.3%。Saxena强调,AI的推理过程并不基于固定的算法规则,而是依赖于从训练数据中学习到的模式,这导致它们的推理过程缺乏一致性和准确性。YAd28资讯网——每日最新资讯28at.com

研究还发现,当AI的训练样本中缺乏某些特定现象,如闰年或复杂的日历规则时,它们的表现会进一步下降。即使模型已经理解了“闰年”这一概念,它们也很难将这个知识正确地应用到具体的视觉判断中。YAd28资讯网——每日最新资讯28at.com

针对这些问题,研究提出了两个改进方向:一是增加训练数据中的代表性示例,以确保AI能够接触到更多样化的情境;二是重新审视AI如何整合逻辑推理与空间感知能力,特别是在处理不常遇到的任务时。这些发现不仅揭示了AI的当前局限,也为未来的研究和开发提供了重要的指导。YAd28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
新疆夜空惊现神秘飞行物,目击者:与月争辉,瞬间加速消失
新疆夜空惊现神秘飞行物,目击者:与月争辉,瞬间加速消失
吉利私有化极氪背后的财务账本:年省百亿,剑指高质量发展
吉利私有化极氪背后的财务账本:年省百亿,剑指高质量发展
50岁大姐考驾照遇挫,教练态度恶劣还学时造假?驾校回应
50岁大姐考驾照遇挫,教练态度恶劣还学时造假?驾校回应
九号电动:700万台销量突破,一季度净利暴涨,智能两轮车新王者崛起?
九号电动:700万台销量突破,一季度净利暴涨,智能两轮车新王者崛起?
电车智驾普及快,为何高价油车却落后?
电车智驾普及快,为何高价油车却落后?
浪漫启航!自治区总工会助力单身职工寻觅北疆良缘
浪漫启航!自治区总工会助力单身职工寻觅北疆良缘
热门内容
  • 夸克AI新升级:深度搜索赋能,信息获取更高效智能
  • 英伟达全球总部或将落户中国台湾,黄仁勋下周宣布这一重大决定?
  • ChatGPT喊你名字了?用户反应不一,个性化尝试遭遇“恐怖谷”
  • 夸克AI新升级“深度搜索”,解锁高效获取信息新技能
  • 蚂蚁集团慷慨分红,单季净利达136亿,阿里持股33%共享成果
  • 教育部新规:学生禁直接复制AI作业,强化独立思考与批判性思维
  • 通义千问3重磅登场!全球顶尖开源模型,通义App与网页版等你来体验
  • 中国首部规范AI气象服务规章6月施行,气象领域将迎来新变革!
  • 小米5月下旬新品爆发:手机平板眼镜手表,你期待哪一款?
  • TIOBE 5月编程语言榜:Python强势领跑,占比创历史新高
  • 苹果新款Apple TV 4K即将发布,四大升级能否重塑智能客厅体验?
  • AI长片《海上女王郑一嫂》登陆新加坡院线,影视创作新时代来临?
  • 小米16曝光:或将新增多功能按键,轻薄机身年底亮相?
  • 教育部新规:中小学分阶段用AI,严禁复制答案强化独立思考
  • 360纳米AI新推MCP万能箱,打造个性化智能体提升效率
本栏最新
小米Civi 5 Pro:轻薄机身里的影像与性能王者?
小米Civi 5 Pro:轻薄机身里的影像与性能王者?
广东移动AI秘书上线:漏接电话不再怕,智能代答新体验!
广东移动AI秘书上线:漏接电话不再怕,智能代答新体验!
火石国际AIGC战略升级,携手兰大文学院开启校企合作新篇章
火石国际AIGC战略升级,携手兰大文学院开启校企合作新篇章
AI闺蜜医生:科学解答女性健康疑惑,守护全生命周期
AI闺蜜医生:科学解答女性健康疑惑,守护全生命周期
中国信息通信网络全球领先,5G应用广泛推动数字经济深度融合
中国信息通信网络全球领先,5G应用广泛推动数字经济深度融合
中国移动AI速记来袭,通话内容秒变文字记录,信息获取更便捷!
中国移动AI速记来袭,通话内容秒变文字记录,信息获取更便捷!

本文链接:http://www.28at.com/showinfo-45-12974-0.htmlAI读不懂时钟,也算不出星期几?基础时间认知成挑战

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 王树国:人文社科在新技术时代不可或缺,文科不会消亡

下一篇: 广州移动携手生态伙伴,共绘大湾区AI落地新蓝图

标签:
  • 热门焦点
  • 挖来Meta AR高管,难道苹果也要进军元宇宙?

    “被曝光”的才是最吸引人的产品,相信有关注过苹果硬件消息的朋友们都明白这样的道理。往近了说有苹果“即将发布”的iPhone SE 3和M2芯片,往远了说有“折叠屏iP
  • 【量子位】虚拟数字人深度产业报告 | 元宇宙Meta洞见

    虚拟数字人行业未来的主要驱动力包括:用户代际变化,新一代消费者对内容消费和虚拟世界更为渴求;虚拟数字人相关技术门槛相对降低,成本有所回落;资本热度上升,受Metav
  • 上海虹口成立10亿元元宇宙基金,香港首只元宇宙ETF拟上市

    区块链日报17日讯 今日《元宇宙新鲜事》有:上海虹口将成立总额约10亿元的元宇宙产业基金;香港市场首只元宇宙主题ETF拟于2月21日上市;元宇宙平台Roblox出现违禁游
  • 虚拟数字人:元宇宙的主角破圈而来

    虚拟数字人市场逐步进入成熟期,商业化进程加速。1982年世界第一位虚拟歌姬林明美诞生,虚拟数字人行业经历了萌芽、探索、初级和成长四个阶段。随技术逐年突破,制
  • 小众有趣NFT艺术作品欣赏(1)

    随着NFT发展火热,越来越多领域与NFT融合,NFT艺术在加密领域中占据了很大一部分。NFT艺术与传统艺术有相似之处,也有完全不同的地方。NFT艺术与传统艺术一样,表现了
  • 下一个黄金赛道?NFT的碎片化!

    碎片化可能是我们一生中最重要的一个投资趋势,碎片化本身并不新鲜。它已经存在了400年之久。早在1602年,荷兰东印度公司是历史上第一家在公共证券交易所上市的公
  • 对讽刺无动于衷,Nori将碳市场放在区块链上

    当我们聊气候问题的解决方案时,以太坊区块链应该不是最首想到的,但这正是Nori所选择的方案,它建立了一个引擎,鼓励农民使用负碳耕作方法,将空气中的碳抽出并放回地
  • 从4个方面解析2022年加密行业趋势

    作者:去月球基础设施瓶颈仍然存在尽管2021年公链基础设施之间的竞争显著升温,但关键瓶颈仍需解决。例如,以太坊作为DApp开发的顶级公链,仍然遭受网络拥塞和高额交
  • PayPal CEO 的加密语录:加密货币将重新定义金融世界

    PayPal 近年来一直是加密行业的倡导者。这个本身拥有超过 3.5 亿名活跃用户的支付巨头,已经允许美国和英国的用户交易或持有比特币(BTC)、以太坊(ETH)、比特现金(BCH

最新推荐

猜你喜欢

热门推荐

相关资讯

Top